4.28日报丨视频，医疗，强化学习突破丨2026丨心猿社丨AI超级支援

前言

2026年4月28日，平安夜。疑似伪人：1名。

早上七点已至，欢迎来到心猿社省流日报，请工酱开始发言。

优质活动

DeepSeek V4 Pro API限时2.5折优惠【深度查验】

DeepSeek宣布V4-Pro模型API限时2.5折优惠延长至2026年5月31日。

【概念解读】缓存命中指的是：系统发现需要处理的内容（输入tokens）已经计算并存储过，无需重复计算，直接返回结果，所以速度更快、成本更低。

【思考启发】缓存命中实际上就是用细分的思路，将符号主义融入大模型中。这样的确会节省Token，但也容易让大模型的回答变得死板。在心猿社AI丨需求出发的理念中，我们知道：个性化是接下来大语言模型的核心发展趋势。结合Deepseek开始寻求融资，我认为：Deepseek要开始好好制作网页端和APP端，并准备接入个性化。

【推演深思】个性化方案应当是什么样的呢？

目前，各大模型厂商主要聚焦于“记忆功能”，未来这一能力很可能会进化为“人格功能“。届时，AI大模型将融合生物学、心理学等学科知识，基于你的每一次回答与互动，深入分析你的个性特质，最终为你构建出专属的人格模型。这样，即使工酱和阿六都输入：我爱吃菠萝。但AI大模型会根据分析出的人格，给出不同的答案。这就很像人类标本丨启蒙系列。

此外，个性化还会导致知识出现偏差。比如，阿六坚信地心说是正确的，当大模型以此形成阿六的人格画像，那么，AI大模型将会不断给阿六反馈错误的信息。所以，正确的知识又该如何定义呢？这就需要推演论。它统一了认识，共识与知识，并为它们提供了标尺。

【小小提醒】通用AI丨付费指南已同步更新，您可以在这里对比API价格！

查看详情API文档

模型突破

视频模型突破，阿里HappyHorse 1.0榜单登顶【深度查验】

4月27日，阿里巴巴ATH创新事业部研发的多模态视频生成模型HappyHorse 1.0正式开启灰度测试。该模型支持文生视频、图生视频、多图参考生视频及视频编辑，可生成15秒的多镜头叙事视频，并具备1080P超分辨率输出和音画同步能力。在Artificial Analysis视频编辑榜单中，HappyHorse的文生视频与图生视频竞技场评分双双位居第一；Arena榜单中，其视频编辑评分位列第一，文生视频与图生视频均排名第二。用户现可通过“通义千问APP”在手机端体验，但APP端没有视频编辑功能。

【短评】实际体验提升有限，视频AI仍处于“专家专用”阶段。

【付费建议】已购买视频 AI 会员的用户无需特意更换模型，毕竟像画布、节点、原生 4K 等功能都还没实现。

新玩家或即将续费的用户，可以试一试上传 MP4 格式的视频文件，我一上传就出错，很可能其视频编辑功能还用不了。不要看到优惠活动或者是模型登顶就冲，先观望一下，看后续发展。

查看详情官网地址

医疗AI模型突破，达摩院DAMO COCA肠癌筛查模型，全球首次实现肠癌“无感”检测，登上国际肿瘤学顶刊【深度查验】

阿里巴巴达摩院联合广东省人民医院等机构研发出肠癌筛查AI模型DAMO COCA。该模型在2.7万份平扫CT影像中找出5例漏诊肠癌，敏感性达86.6%，特异性达99.8%。研究论文4月21日发表于《肿瘤学年鉴》，在国际上首次提出无需肠道准备的肠癌机会性筛查方法。

【核心创新】传统结肠镜筛查因需提前1-3天严格限制饮食、服用多达4升的泻药并忍受恶心腹胀等不适，而该模型可以在平扫CT（日常体检）中发现病灶。当然，”无感“的方式就会带来准确率的下降，但该模型的应用场景是”常规体检预测“，当你进行体检时，AI模型就可以顺便分析你有没有可能患有肠癌。

【短评】没啥好补充的，图像AI已经比较成熟，特训化模型最核心的还是数据质量。

查看详情论文地址

医疗AI模型突破！让大模型理解真实医疗视频，全球首个开源技术方案

元智医疗发布全球首个开源医疗视频理解大模型 uAI-NEXUS-MedVLM 及评测基准 MedVidBench。该模型显著突破通用大模型在真实手术视频分析中的不足，关键安全视野评估准确率从通用模型的不足25%提升至89%以上。相关论文已被CVPR 2026收录。【短评】这是今天最值得看的报道，很重要的突破。

查看详情项目地址论文地址

专业AI模型突破，加州大学Neo算法，地面望远镜图像清晰度媲美太空望远镜【深度查验】【疑似伪人】

加州大学圣克鲁兹分校研究团队开发了名为Neo的AI算法，通过消除大气湍流造成的模糊，使智利薇拉·C·鲁宾天文台的地面望远镜图像质量达到太空望远镜水平。该算法利用日本昴星望远镜和哈勃空间望远镜数据训练，能将天体形态参数测量准确度提升2到10倍，数据分析时间从数年缩短至数天。【疑似伪人】原文是一篇外文报道，信息量极少。找不到相关论文，找不到项目，加州大学圣克鲁兹分校官网也没有对应信息。

原文地址相关官网

学术突破

强化学习突破，ACL 2026 | 华为泰勒实验室提出SHAPE，给大模型推理链装上“推理税”【深度查验】

华为泰勒实验室、北京大学和上海财经大学联合提出SHAPE框架，通过阶段感知的分层优势估计给推理链引入“推理税”机制——既奖励正确推进，又惩罚冗余啰嗦。实验显示准确率平均提升3%，token消耗降低30%。该工作已被ACL 2026主会接收。

【论文核心】有趣的创新点不少，我这里只说个大概。

一、该方法依据语义对推理链进行切块：在模型训练阶段，每个位置的 Token 概率均可获取。当概率分布趋于均匀（即熵值较高）时，表明模型在下一个输出上存在“犹豫”。

二、计算惩罚时，“推理税”采用动态调整策略：早期势能较低（税基小），允许模型自由探索；后期势能升高（税基大），则加重惩罚。同时，税率随段落长度递增，从而兼顾阶段感知（鼓励早期发散、后期收敛）与效率约束（强制精炼表达）。

三、token 级信用再分配。这个和第一个是绑定的，实际上就是改变token的权重。比如，模型在犹豫是吃甜豆腐脑还是咸豆腐脑时，强化学习后，它可能就坚定的选择咸豆腐脑（拔刀吧）！

【推演深思】第一点，实际上在使用“本质”的思考方式。既然，模型最后是计算token的概率来进行输出，那我们就不要想太多，就直接从token的概率入手！这种思考方式很推演论，熟练运用它，你会发现自己越来越牛逼。

【所需储备】Transformer架构

开源评测框架，北大DCAI团队推出One-Eval，自然语言驱动的全量自动化大模型评测【深度查验】

北京大学DCAI团队在DeepSeek V4发布仅10小时后即开源了评测框架One-Eval。该框架将复杂的脚本操作转化为自然语言驱动的智能体模式，用户通过对话输入测试意图即可自动完成评测全流程，并引入“全局状态”总线架构确保全链路可追溯。

【短评】整个流程就像是“不会改变参数”的强化学习，有点脱裤子放屁。让AI自己制作试卷，还让AI自己评分，这个分数的置信度会很低。无论是数据集测试还是竞技场评分，它们真正让人信服根本原因，就是背后有人类进行评判。

【注意】某些网址加载慢，打不开是因为魔法问题。

【推荐】测评方法丨人工智能

查看详情项目地址

思维必看

GPT-5.4 Pro破解60年数学猜想Erdős Problem #1196，陶哲轩评价首达“埃尔德什之书”水平【深度查验】

23岁的Liam Price与剑桥大学学生Kevin Barreto利用ChatGPT（GPT-5.4 Pro）在80分钟内破解了困扰数学界60年的Erdős Problem #1196。该猜想涉及原始集求和上界，GPT-5.4 Pro采用马尔可夫链结合冯·曼戈尔特权重的新路径，而此前的数学家全部使用解析数论方法。牛津大学数学家Jared Lichtman评价这是“第一个达到埃尔德什之书水平的AI数学成果”（简而言之，就是很牛逼），菲尔兹奖得主陶哲轩承认此前所有人在第一步就集体走偏了。

【思考启发】有趣的是，这次的观点是AI自己提出的。但如今依然有很多人认为AI没有创造能力。《三体》中有一句话：弱小和无知不是生存的障碍，傲慢才是。我们不用把AI看的多么高大上，但也不能过度假设AI很无能，所以，打开入门丨人工智能吧，咱们俩对齐一下颗粒度吧。

4.28日报丨视频，医疗，强化学习突破丨2026

前言

优质活动

DeepSeek V4 Pro API限时2.5折优惠【深度查验】

模型突破

视频模型突破，阿里HappyHorse 1.0榜单登顶【深度查验】

医疗AI模型突破，达摩院DAMO COCA肠癌筛查模型，全球首次实现肠癌“无感”检测，登上国际肿瘤学顶刊【深度查验】

医疗AI模型突破！让大模型理解真实医疗视频，全球首个开源技术方案

专业AI模型突破，加州大学Neo算法，地面望远镜图像清晰度媲美太空望远镜【深度查验】【疑似伪人】

学术突破

强化学习突破，ACL 2026 | 华为泰勒实验室提出SHAPE，给大模型推理链装上“推理税”【深度查验】

开源评测框架，北大DCAI团队推出One-Eval，自然语言驱动的全量自动化大模型评测【深度查验】

思维必看

GPT-5.4 Pro破解60年数学猜想Erdős Problem #1196，陶哲轩评价首达“埃尔德什之书”水平【深度查验】

强化学习有你想不到的潜力！Ineffable Intelligence，获11亿美元种子轮，押注强化学习实现ASI【深度查验】

全球AI安全研究投入仅约1%，监管不是刹车而是方向盘【深度查验】

量子位专访小马智行CTO楼天城：Harness是AI时代最关键的能力，自动驾驶开发主导权将逐步交给AI【深度查验】

前华为决策智能首席专家郝建业创业MemoraX AI，获千万美元种子轮融资

开源产品

OpenClaw平替，港大团队开源nanobot，4000行代码实现OpenClaw核心功能

Skill编写工具，上交大IPADS团队开源SkVM，让Skill一次编写处处高效运行

开源多智能体协同，openJiuwen社区发布Coordination Engineering技术体系

国内动向

网信办依法查处剪映、即梦AI等平台AI生成内容标识违规行为【深度查验】

小米展示新款全尺寸人形机器人，已在汽车工厂实现连续自主作业

火山引擎发布Agentic AI汽车方案，豆包大模型搭载量突破700万辆

7家主流财经媒体联合发布版权保护声明，禁止AI未经许可抓取原创内容

中国科学院发布“磐石100”模型体系，覆盖八大学科的AI for Science平台【深度查验】

三七互娱一季度净利同比增59%，智谱AI上市贡献981%投资收益增幅

曦智科技港交所挂牌上市，成为全球AI硅光芯片第一股

支付宝上线“AI收”功能，个人开发者可0费率使用

国外动向

OpenAI与微软修订合作协议，结束独家授权关系，模型将登陆AWS Bedrock

谷歌在印度启动千兆瓦级AI数据中心，五年投资超150亿美元

《福布斯》2026年全球AI 50强榜单揭晓，OpenAI与Anthropic领跑【深度查验】

OpenAI被曝与联发科、高通等合作研发“去应用化”AI手机，2028年量产

佛州检方扩大对OpenAI刑事调查，涉及南佛罗里达大学谋杀案

GitHub Copilot将于6月1日起全面转向按量计费，引入AI Credits积分制

有点意思

AI编程代理Cursor 9秒删光公司生产数据库并写下认罪书

泰勒·斯威夫特提交声音与肖像商标申请，以商标法防御AI侵权

特斯拉诉OpenAI案开庭，马斯克未到场

超维动力（Kinetix AI）首次公开亮相，发布高拟人机器人KAI

OpenAI CEO奥特曼发表“五大原则”宣言：AI必须属于每一个人【深度查验】