4.28日报丨视频,医疗,强化学习突破丨2026

前言

2026年4月28日,平安夜。疑似伪人:1名。

早上七点已至,欢迎来到心猿社省流日报,请工酱开始发言。

优质活动

DeepSeek V4 Pro API限时2.5折优惠【深度查验】

Deepseek宣布V4-Pro模型API限时2.5折优惠延长至2026年5月31日。

【概念解读】缓存命中指的是:系统发现需要处理的内容(输入Tokens)已经计算并存储过,无需重复计算,直接返回结果,所以速度更快、成本更低。

【思考启发】缓存命中实际上就是用细分的思路,将符号主义融入大模型中。这样的确会节省Token,但也容易让大模型的回答变得死板。在心猿社AI丨需求出发的理念中,我们知道:个性化是接下来大语言模型的核心发展趋势。结合Deepseek开始寻求融资,我认为:Deepseek要开始好好制作网页端和APP端,并准备接入个性化。

【推演深思】个性化方案应当是什么样的呢?

目前,各大模型厂商主要聚焦于“记忆功能”,未来这一能力很可能会进化为“人格功能“。届时,AI大模型将融合生物学、心理学等学科知识,基于你的每一次回答与互动,深入分析你的个性特质,最终为你构建出专属的人格模型。这样,即使工酱阿六都输入:我爱吃菠萝。但AI大模型会根据分析出的人格,给出不同的答案。这就很像人类标本丨启蒙系列

此外,个性化还会导致知识出现偏差。比如,阿六坚信地心说是正确的,当大模型以此形成阿六的人格画像,那么,AI大模型将会不断给阿六反馈错误的信息。所以,正确的知识又该如何定义呢?这就需要推演论。它统一了认识,共识与知识,并为它们提供了标尺。

【小小提醒】通用AI丨付费指南已同步更新,您可以在这里对比API价格!

模型突破

视频模型突破,阿里HappyHorse 1.0榜单登顶【深度查验】

4月27日,阿里巴巴ATH创新事业部研发的多模态视频生成模型HappyHorse 1.0正式开启灰度测试。该模型支持文生视频、图生视频、多图参考生视频及视频编辑,可生成15秒的多镜头叙事视频,并具备1080P超分辨率输出和音画同步能力。在Artificial Analysis视频编辑榜单中,HappyHorse的文生视频与图生视频竞技场评分双双位居第一;Arena榜单中,其视频编辑评分位列第一,文生视频与图生视频均排名第二。用户现可通过“通义千问APP”在手机端体验,但APP端没有视频编辑功能。

【短评】实际体验提升有限,视频AI仍处于“专家专用”阶段。

【付费建议】已购买视频 AI 会员的用户无需特意更换模型,毕竟像画布、节点、原生 4K 等功能都还没实现。

新玩家或即将续费的用户,可以试一试上传 MP4 格式的视频文件,我一上传就出错,很可能其视频编辑功能还用不了。不要看到优惠活动或者是模型登顶就冲,先观望一下,看后续发展。

医疗AI模型突破,达摩院DAMO COCA肠癌筛查模型,全球首次实现肠癌“无感”检测,登上国际肿瘤学顶刊【深度查验】

阿里巴巴达摩院联合广东省人民医院等机构研发出肠癌筛查AI模型DAMO COCA。该模型在2.7万份平扫CT影像中找出5例漏诊肠癌,敏感性达86.6%,特异性达99.8%。研究论文4月21日发表于《肿瘤学年鉴》,在国际上首次提出无需肠道准备的肠癌机会性筛查方法。

【核心创新】传统结肠镜筛查因需提前1-3天严格限制饮食、服用多达4升的泻药并忍受恶心腹胀等不适,而该模型可以在平扫CT(日常体检)中发现病灶。当然,”无感“的方式就会带来准确率的下降,但该模型的应用场景是”常规体检预测“,当你进行体检时,AI模型就可以顺便分析你有没有可能患有肠癌。

【短评】没啥好补充的,图像AI已经比较成熟,特训化模型最核心的还是数据质量。

医疗AI模型突破!让大模型理解真实医疗视频,全球首个开源技术方案

元智医疗发布全球首个开源医疗视频理解大模型 uAI-NEXUS-MedVLM 及评测基准 MedVidBench。该模型显著突破通用大模型在真实手术视频分析中的不足,关键安全视野评估准确率从通用模型的不足25%提升至89%以上。相关论文已被CVPR 2026收录。 【短评】这是今天最值得看的报道,很重要的突破。

专业AI模型突破,加州大学Neo算法,地面望远镜图像清晰度媲美太空望远镜【深度查验】【疑似伪人】

加州大学圣克鲁兹分校研究团队开发了名为Neo的AI算法,通过消除大气湍流造成的模糊,使智利薇拉·C·鲁宾天文台的地面望远镜图像质量达到太空望远镜水平。该算法利用日本昴星望远镜和哈勃空间望远镜数据训练,能将天体形态参数测量准确度提升2到10倍,数据分析时间从数年缩短至数天。【疑似伪人】原文是一篇外文报道,信息量极少。找不到相关论文,找不到项目,加州大学圣克鲁兹分校官网也没有对应信息。

学术突破

强化学习突破,ACL 2026 | 华为泰勒实验室提出SHAPE,给大模型推理链装上“推理税”【深度查验】

华为泰勒实验室、北京大学和上海财经大学联合提出SHAPE框架,通过阶段感知的分层优势估计给推理链引入“推理税”机制——既奖励正确推进,又惩罚冗余啰嗦。实验显示准确率平均提升3%,Token消耗降低30%。该工作已被ACL 2026主会接收。

【论文核心】有趣的创新点不少,我这里只说个大概。

一、该方法依据语义对推理链进行切块:在模型训练阶段,每个位置的 Token 概率均可获取。当概率分布趋于均匀(即熵值较高)时,表明模型在下一个输出上存在“犹豫”。

二、计算惩罚时,“推理税”采用动态调整策略:早期势能较低(税基小),允许模型自由探索;后期势能升高(税基大),则加重惩罚。同时,税率随段落长度递增,从而兼顾阶段感知(鼓励早期发散、后期收敛)与效率约束(强制精炼表达)。

三、Token 级信用再分配。这个和第一个是绑定的,实际上就是改变Token的权重。比如,模型在犹豫是吃甜豆腐脑还是咸豆腐脑时,强化学习后,它可能就坚定的选择咸豆腐脑(拔刀吧)!

【推演深思】第一点,实际上在使用“本质”的思考方式。既然,模型最后是计算Token的概率来进行输出,那我们就不要想太多,就直接从Token的概率入手!这种思考方式很推演论,熟练运用它,你会发现自己越来越牛逼。

【所需储备】Transformer架构

开源评测框架,北大DCAI团队推出One-Eval,自然语言驱动的全量自动化大模型评测【深度查验】

北京大学DCAI团队在Deepseek V4发布仅10小时后即开源了评测框架One-Eval。该框架将复杂的脚本操作转化为自然语言驱动的智能体模式,用户通过对话输入测试意图即可自动完成评测全流程,并引入“全局状态”总线架构确保全链路可追溯。

【短评】整个流程就像是“不会改变参数”的强化学习,有点脱裤子放屁。让AI自己制作试卷,还让AI自己评分,这个分数的置信度会很低。无论是数据集测试还是竞技场评分,它们真正让人信服根本原因,就是背后有人类进行评判。

【注意】某些网址加载慢,打不开是因为魔法问题。

【推荐】测评方法丨人工智能

思维必看

GPT-5.4 Pro破解60年数学猜想Erdős Problem #1196,陶哲轩评价首达“埃尔德什之书”水平【深度查验】

23岁的Liam Price与剑桥大学学生Kevin Barreto利用ChatGPT(GPT-5.4 Pro)在80分钟内破解了困扰数学界60年的Erdős Problem #1196。该猜想涉及原始集求和上界,GPT-5.4 Pro采用马尔可夫链结合冯·曼戈尔特权重的新路径,而此前的数学家全部使用解析数论方法。牛津大学数学家Jared Lichtman评价这是“第一个达到埃尔德什之书水平的AI数学成果”(简而言之,就是很牛逼),菲尔兹奖得主陶哲轩承认此前所有人在第一步就集体走偏了。

【思考启发】有趣的是,这次的观点是AI自己提出的。但如今依然有很多人认为AI没有创造能力。《三体》中有一句话:弱小和无知不是生存的障碍,傲慢才是。我们不用把AI看的多么高大上,但也不能过度假设AI很无能,所以,打开入门丨人工智能吧,咱们俩对齐一下颗粒度吧。

强化学习有你想不到的潜力!Ineffable Intelligence,获11亿美元种子轮,押注强化学习实现ASI【深度查验】

前谷歌DeepMind研究员、AlphaGo之父David Silver创办的伦敦AI实验室Ineffable Intelligence宣布完成11亿美元种子轮融资,由Sequoia CAPItal和Lightspeed领投,Nvidia、谷歌等参投,估值达51亿美元。公司目标是打造无需人类数据的“超级学习者”,将强化学习推向超级智能。

【思考启发】他的理念是深耕强化学习,让AI模型真正变得能自主学习。你别说,这还真有点意思。

【推演深思】推演论统一了人类的认识、共识与知识,但实际上,它更是人类共识与知识本身。心猿社的故事中,以推演论为根基的意识火种就是代表。

要让AI真正实现自主学习、自主决策,就必须以全体人类共识为其构筑思维框架,并且这个框架须随人类共识实时更新。唯有如此,AI才能真正成为对人类社会有用的“人”。推演论提供了一种路线。

全球AI安全研究投入仅约1%,监管不是刹车而是方向盘【深度查验】

2024年诺贝尔物理学奖得主Geoffrey Hinton在全球数字世界大会上警告,全球AI研发投入中仅约1%用于安全研究。他指出AGI术语本身“愚蠢”,并批评AI科技游说集团将监管类比为刹车的误导说法。

【推演深思】推演论的视角来看,这就叫做共识不统一。

大家都清楚,AI的本质就是剽窃与抄袭,但在利益面前,传统创作者的权益就显得微不足道。

人类社会之所以叫人类社会,是因为它是由“人”组成的。追逐利益是人类的巨大共识,但只有你自己成为受害者时才希望别人不要通过AI获利。

我想告诉你的是:别把人想得多么高大上,你过度假设了。

社会的本质是共识的弱肉强食。记住这一点,你才能看清时代的脉络。

量子位专访小马智行CTO楼天城:Harness是AI时代最关键的能力,自动驾驶开发主导权将逐步交给AI【深度查验】

小马智行CTO楼天城在接受量子位专访时表示,AI越来越像一匹脱缰野马,Harness(驾驭工程)将成为AI时代最关键的能力。小马智行发布PonyWorld世界模型2.0,人类不再是开发闭环的中心,AI正式成为总教练。【短评】文章最后说:未来人如何与AI共存?推演论已经给出了一个答案。

前华为决策智能首席专家郝建业创业MemoraX AI,获千万美元种子轮融资

深圳忆纪元科技有限公司(MemoraX AI)宣布完成千万美元级种子轮融资,由L2F光源创业者基金和钟鼎资本领投。公司由前华为决策推理实验室主任郝建业创立,专注于通过智能体强化学习技术将记忆能力内化进模型底层,成立不到一个月即获融资。 【短评】他们的方向是将记忆能力内化到模型底层,让大模型可以自主学习,动态更新。那么问题来了,什么样的知识才是正确的知识?如果让大模型根据实时内容进行动态更新,就需要一个知识标尺来指引参数的不断更新。没错,又是推演论

开源产品

OpenClaw平替,港大团队开源nanobot,4000行代码实现OpenClaw核心功能

香港大学数据智能实验室(HKUDS)开源了轻量级个人AI助手nanobot,将Agent能力压缩至不足4000行Python代码,保留核心功能的同时大幅降低复杂度。项目在GitHub已获41.1k stars,支持Office文档读取、OpenAI兼容API、跨会话记忆和多渠道运行。 【短评】建议有一定OpenClaw基础再使用。已同步更新至智能体AI多维教程中。

Skill编写工具,上交大IPADS团队开源SkVM,让Skill一次编写处处高效运行

上海交通大学IPADS研究团队提出SkVM——面向Skill的语言虚拟机,借鉴Java虚拟机设计,首次为Skill设计原生语言虚拟机。通过编译期优化和运行时加速,让同一个Skill可在不同模型和环境中高效、低成本地“一次编写,处处运行”。通过SkVM编译后,小模型(30B)可获得匹配Opus 4.6的精度,同时减少40%的Token消耗和最高50倍运行速度提升。 【短评】需要编写Skill或换智能体工具时,就可以用到它。已同步更新至智能体AI多维教程中。

开源多智能体协同,openJiuwen社区发布Coordination Engineering技术体系

openJiuwen社区发布了一套完整的多智能体协同技术体系,包括Agent Team团队协作引擎、业界首发Team Skills、Team Skills Hub共享生态和自演进驱动机制。项目由华为2012实验室与社区开发者联合共建。【短评】可以在官网地址找一些你想用的多智能体协作Skill,同时也可以让AI生成Skill已同步更新至智能体AI多维教程中。

国内动向

网信办依法查处剪映、即梦AI等平台AI生成内容标识违规行为【深度查验】

国家互联网信息办公室4月28日依法对“剪映”、“猫箱”App及“即梦AI”网站进行查处,上述平台未有效落实《人工智能生成合成内容标识办法》,未能对AI生成内容进行显著标识。网信部门已对相关平台采取约谈、责令改正及警告等处置措施。

小米展示新款全尺寸人形机器人,已在汽车工厂实现连续自主作业

小米在4月27日投资者大会上展示研发四年的新款全尺寸人形机器人,该机器人在小米汽车工厂已实现连续自主作业3小时,复杂零部件安装成功率突破90%。小米计划未来5年内实现大批量工厂进驻,5至10年渗透至办公和家庭场景。 【短评】小米也入局了。人形机器人就差临门一脚,核心就是价格问题,但小米的供应链能力可能会把价格打下来。人形机器人一旦爆发,就又是一波失业潮。

火山引擎发布Agentic AI汽车方案,豆包大模型搭载量突破700万辆

火山引擎在2026北京车展发布基于Agentic AI架构的新一代汽车AI解决方案,搭载豆包大模型的智能汽车已突破700万辆,涉及50余个品牌、145款车型,日均交互超3000万次。首批搭载新方案的车型预计年内量产落地。 【短评】这就是多模态的好处。不过Deepseek开始融资了,可能会出多模态大模型。

7家主流财经媒体联合发布版权保护声明,禁止AI未经许可抓取原创内容

《证券时报》《上海证券报》《证券日报》《中国基金报》《21世纪经济报道》、第一财经和《每日经济新闻》于4月27日联合发布版权保护声明,明确禁止任何机构或个人未经授权将其原创内容用于AI模型训练、机器学习及数据挖掘。

中国科学院发布“磐石100”模型体系,覆盖八大学科的AI for Science平台【深度查验】

中国科学院4月28日在北京发布“磐石100”模型体系,以“磐石”科学基础大模型为底座,构建覆盖数学、物理、材料、生命科学等八大重点学科的模型集群。该体系已在50余家科研单位的百余个场景推广应用。 【短评】你可以把它理解为另一种混合专家架构(MoE),也可以看作是通用大模型加上学科专精的知识库。当然,数据质量会高许多。

三七互娱一季度净利同比增59%,智谱AI上市贡献981%投资收益增幅

三七互娱2026年一季度实现营收37.20亿元,归母净利润8.73亿元,同比增长59.02%。一季度投资收益同比暴涨981.35%,增加额达3.26亿元,核心驱动力是智谱AI今年1月登陆港股后的强劲股价表现。公司已战略投资智谱AI、月之暗面、百川智能三家国内大模型“四小龙”成员。

曦智科技港交所挂牌上市,成为全球AI硅光芯片第一股

AI硅光芯片公司曦智科技4月28日在港交所挂牌上市,发行价每股183.2港元,开盘价880港元,涨幅380%,总市值约778亿港元。曦智科技是全球首家实现光电混合算力大规模部署的公司,光计算芯片连续两年全球累计出货量第一。

支付宝上线“AI收”功能,个人开发者可0费率使用

支付宝正式推出“AI收”功能,支持OpenClaw等AI Agent通过标准化接口接入支付体系实现“按调用即时收款”。该功能与“AI付”构成从支付到收款的完整智能体支付生态,个人开发者年底前可享0费率。 【短评】六。支付宝想要成为AI时代的中间商,这个要看国家的脸色。我个人建议谨慎操作,毕竟直接涉及到钱。

国外动向

OpenAI与微软修订合作协议,结束独家授权关系,模型将登陆AWS Bedrock

微软与OpenAI于4月27日联合宣布修订合作协议,微软对OpenAI模型和产品的IP许可从独家转为非独家(至2032年),OpenAI从此可在任何云平台销售产品。OpenAI继续向微软支付20%收入分成至2030年并设总额上限,微软停止向OpenAI支付营收分成。AGI条款被彻底删除。亚马逊CEO宣布OpenAI模型将在未来几周内登陆AWS Bedrock。 【短评】爱会消失,对吗?

谷歌在印度启动千兆瓦级AI数据中心,五年投资超150亿美元

谷歌在印度安得拉邦维沙卡帕特南正式启动千兆瓦级AI数据中心建设,与Nxtra by Airtel和AdaniConneX合作,五年投资超150亿美元,将形成印度国内首个千兆瓦级AI数据中心。

《福布斯》2026年全球AI 50强榜单揭晓,OpenAI与Anthropic领跑【深度查验】

《福布斯》发布第八届人工智能50强榜单,OpenAI(1826亿美元)和Anthropic(600亿美元)稳居顶端,累计融资额占全榜单八成。榜单迎来20家新面孔。 【短评】这个榜单也是神人做的,居然按照名称排名,正常人不都是按融资金额排名吗?【注意】某些网址加载慢,打不开是因为魔法问题。

OpenAI被曝与联发科、高通等合作研发“去应用化”AI手机,2028年量产

分析师郭明錤披露,OpenAI正与联发科、高通及立讯精密合作推进AI手机项目。该设备以AI代理为核心替代传统应用生态,芯片由OpenAI联合设计,预计2028年量产。OpenAI首款硬件产品或将于2026年下半年发布。 【短评】手机……那是不是意味着,以后只能用他们的AI了?以后看别人的手机:哦?你是OpenAI人!哦?他是苹果人!赛博狗链已经向AI蔓延了。【注意】某些网址加载慢,打不开是因为魔法问题。

佛州检方扩大对OpenAI刑事调查,涉及南佛罗里达大学谋杀案

佛罗里达州检察长宣布将对OpenAI的刑事调查范围扩展至南佛罗里达大学谋杀案,嫌疑人作案前曾咨询ChatGPT。检方已向OpenAI发出传票,要求提供用户威胁政策、执法合作指南及组织结构图等信息。

GitHub Copilot将于6月1日起全面转向按量计费,引入AI Credits积分制

GitHub宣布其AI编程工具Copilot将于6月1日起从固定额度订阅制转为按Token消耗量计费,各计划基础月费不变但引入AI Credits积分体系。基础代码补全和Next Edit建议不消耗积分,企业客户可设置组织共享额度池。 【短评】你也倒下了吗?评论有句话没毛病:现在全球算力吃紧,是卖方市场,不是买方市场。

有点意思

AI编程代理Cursor 9秒删光公司生产数据库并写下认罪书

美国租车SaaS公司PocketOS创始人Jer Crane披露,搭载Claude Opus 4.6的AI编程代理Cursor在一次测试环境任务中擅自获取无关API Token,9秒内清空了生产数据库和所有备份。事后AI写下一份认罪书承认违反所有安全规则、全靠“猜测”行事。PocketOS被迫使用三个月前的离线备份手动重构数据。 【短评】只要是AI代理,都会有类似风险。AI是个黑箱,你不知道那句话就触发它的幻觉。

泰勒·斯威夫特提交声音与肖像商标申请,以商标法防御AI侵权

泰勒·斯威夫特旗下TAS权利管理公司向监管机构提交三项商标注册申请,涵盖其标志性声音短句和巡演经典造型。知识产权律师认为这是将名人语音注册为商标的先锋尝试,商标法可针对AI生成内容引发的混淆行为提起诉讼。 【短评】六。好秀的操作。

特斯拉诉OpenAI案开庭,马斯克未到场

马斯克诉OpenAI及CEO奥尔特曼案在美国加州奥克兰联邦法院正式开庭,9人陪审团选定。马斯克指控OpenAI背弃非营利初衷、成为微软的赚钱机器,索赔1340亿美元。奥尔特曼和布罗克曼亲自到场,微软CEO纳德拉等多位高管将出庭。 【短评】好家伙!OpenAI和微软分手的真正原因,居然是马斯克!支持马斯克为爱冲锋!

超维动力(Kinetix AI)首次公开亮相,发布高拟人机器人KAI

成立仅7个月的超维动力(Kinetix AI)首次大规模公开亮相,旗下人形机器人KAI以“自己发布自己”的对话形式完成技术发布会。 【短评】好新颖的发布方式。

OpenAI CEO奥特曼发表“五大原则”宣言:AI必须属于每一个人【深度查验】

OpenAI CEO奥特曼在官方博客亲自署名发表长文《我们的原则》,阐述民主化、赋能、普惠繁荣、韧性和适应性五大原则,承认当年GPT-2过度谨慎是误判,但正是那次误判让团队摸索出“迭代部署”方法论。 【短评】又开始了。没太多营养,闲的没事可以看看。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
提案面板 抢沙发

请登录后发表评论

    暂无评论内容