【AI日报·6/28】测试中—2025刊

社群交流微信公众号图标

媒体矩阵联系我们图标

AI工具箱请求更新图标

栏目介绍

前言.

今日更新：

【AI+英语协同】单词&短语背记方案，双端同步版——自动化更新：消除扇贝划选单词会出现的悬浮框，方便看句子。

目前已经上线滴工具&板块：

【资讯类】省流日报；最新突破表；测试集整理；企业资讯；热点捕捉；优质活动；开源与产品；
【知识类】思维屋；AI必备知识
【评估类】横向测评；最新进程；AI社会改造；学术深思
【教学类】AI教学（签到免费）；AI多维板（学生党板块免费）
【实用类】金选工具箱

标签解析：

【伪人资讯】：虽然心猿社对资讯的真实性，时效性，广告问题已经做了初步的人工筛选，但仍然有社会影响大的，内容存在虚假的资讯存在，这样的资讯我们会标注上“伪人资讯”，目的是进行澄清，防止大家被外面的资讯误导。

【仔细查验】：每一篇资讯心猿社都会继续人工查验，其中，我们认为要仔细核实，或者是要仔细阅读来帮助大家阅读的资讯，心猿社会进行“仔细查验”。

【追踪】：心猿社会对仍然有疑问的资讯进行追踪，追踪结果若与原资讯出入很大，心猿社会在后面的省流日报公布。

板块解析：

【产品突破】和【研究突破】：由于心猿社还处于信息库建立的初级阶段，所以部分不算突破的突破有时也会划进去，这是因为心猿社对该领域信息库建立的还不完善的缘故。

【学术深思】：依据心猿社理论体系，对资讯进行延伸解读。

有关超链接观感问题：您所看到的超链接（如心猿社）的实现是我们自己手搓的插件，目前还有许多需要优化的地方（比如白名单，黑名单功能等），所以有的地方视觉体验还不那么好，见谅呀。

产品突破！

智能家居模型突破，算法能力提升，架构升级，萤石蓝海大模型【仔细查验】

6月26日，萤石网络推出萤石蓝海大模型2.0版本，实现感知、理解、记忆等算法能力升级，新推垂直场景混合大模型，覆盖多个领域。同时升级AI核心架构EZVIZ HomePlay OS ，涉及场景化智能体、设备开放和App开放等层面，并分享多垂直场景落地成果。【短评】就是综合能力都提高了，这个也不好对比，感兴趣就直接看详情吧~

查看详情

声音克隆上线APP端，成品难辨真假且素材需求短，科大讯飞【仔细查验】【伪人资讯】

科大讯飞升级声音复刻技术，在讯飞星火App和开放平台上线新版功能。用户通过选择性别、朗读一句话即可快速创建自定义发音人，学习素材仅需不到10s，复刻效果能精准还原多种发音特征，达到人机难辨的程度，还在多领域广泛应用。

【短评】现在的AI语音克隆聚焦在情绪，看示例效果确实可以，但是网页端是没有的，想要快捷体验，得去APP端，而且功能性非常有限，克隆完声音只能用来和自己对话；如果你想克隆声音，可以看MiniMax的海外版（就是以前的海螺问问），它的语音克隆目前可以说是TTS（文本转语音）第一梯队的水平。
【伪人鉴定】首先，给的视频例子有问题，这个例子是RVC技术（你可以理解为AI翻唱），现在的TTS根本做不到这么细腻的情绪表达，而这个上线的新功能很明显是TTS技术，RVC和TTS，这可差得太远了——意思就是，这个上线的新功能是无法实现例子中的效果的，这很容易误导大家。其次，网络上说有去和其他工具对比，也就是打榜，但是心猿社没有找到相应的内容。但是心猿社还是把它放在了产品突破中，原因是APP端的AI工具基本上就都没有声音克隆技术，而且讯飞在声音克隆上确实是有一套的。
【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情MiniMax国内MiniMax海外

研究突破:）

通用AI强化学习突破，RLPR技术拓展通用推理，清华NLP实验室【仔细查验】

清华大学自然语言处理实验室提出基于参考概率奖励的强化学习（RLPR）技术。该技术通过Prob-to-Reward方法提高概率奖励质量，还提出基于奖励标准差的动态过滤机制，提升强化学习稳定性和性能。RLPR解决了现有基于可验证奖励的强化学习（RLVR）范式的领域依赖问题，在多种主流模型上验证了有效性。

【论文核心】这个方法的逻辑是让模型反复试生成推理答案，用 “生成正确答案的概率” 当积分，积分高的操作就多鼓励（参数往这个方向调），同时过滤掉无效生成，让模型越练越会推理。传统的强化学习要对每个学科找个裁判，用外部的这些裁判对模型的生成质量打分，分数高的进行鼓励；这个方法就不需要了，只需要规定一个标准答案，就可以让模型自己奖励自己。
【思考启发】这套方法的目前面临的局限是：要进行更大量的数据工作，简单的答案还好，但是那种长文本答案，处理的量大，难度也高；但这是通用AI正确的方向，现在的大语言模型基本是MOE架构的江山，MOE最大的问题就是模块化，当你询问问题，它会先分析你的问题，再决定调用哪些模块（比如数学，比如生物）——所以RLPR这套方案好处非常明显，减去了中间过程，高度的一体性：比如正确答案是 “水”，模型答 “H2O”，传统裁判可能判错，但 RLPR 看 “水” 和 “H2O” 的概率都很高，会给高分。
【学术深思】这个模式其实就和心猿社的推演论非常像，只不过，推演论虽然是用语言作为载体，但讨论的是世界各个事物的联系（逻辑链工程）。它的核心是对一种复合表达（以一句话为载体）不断进行拆解，不断建立“索引分析”的同时进行“混沌分析”，从而不断接近世界的本质。没错，什么是世界的本质？人类社会来到了这个关键的节点——心猿社将探寻这种本质的方向分为“尺度论”与“维度论”。
【学术深思2】不光是这篇论文，前几天的华为HDC大会对AI的发展也笃定在“原子化”思想（点我查看）；哈佛大学成功在蝌蚪脑内实现单神经元电活动的连续追踪，支持5天以上全脑动态记录（点我查看）；字节跳动与上海交大推出的 ProtoReasoning 框架便是依据“AI模型训练中的跨域泛化能力现象”——AI模型在数学上训练后，在逻辑推理，创意写作上也表现出色（点我查看）；物质与相互作用，生物反射，意识数据，混沌分析和索引分析，这些实际上是同一个思路，心猿社目前给出的方案是用“尺度论”，“推演论”，“人文社科模型”来诠释这个思路。
【关联测评集】MMLU-Pro，GPQA Diamond，TheoremQA，MATH-500，Minerva——Avg@2的意思是 “前两次尝试的平均得分”
【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址论文地址

扩散语言模型强化训练突破，coupled-GRPO算法提升性能，苹果公司

苹果研究团队针对扩散语言模型（dLLM）后训练问题，提出coupled-GRPO算法。该算法基于对DiffuCoder的分析，通过定制优化GRPO，采用全新耦合采样方案，在训练dLLM时实现更稳定的奖励学习与更低的自回归性，显著提升生成质量与并行效率。实验结果验证了强化学习与扩散模型结合的潜力。

【短评】就是优化了扩散语言模型强化学习的方法。大模型的核心是“猜词”，比如一句话是 “今天很热，适合吃…”，那么模型就要猜下一个词是什么，猜对了有奖励，猜错了有惩罚，模型通过不断试错，学会优先猜能拿奖励的词，最终生成更符合要求的内容——这个就叫强化学习。【注意】某些网址加载慢，打不开是因为魔法问题。

名词解析

【AI日报·6/28】测试中—2025刊

前言.

优质活动

开源与产品

产品突破！

智能家居模型突破，算法能力提升，架构升级，萤石蓝海大模型【仔细查验】

声音克隆上线APP端，成品难辨真假且素材需求短，科大讯飞【仔细查验】【伪人资讯】

研究突破:）

通用AI强化学习突破，RLPR技术拓展通用推理，清华NLP实验室【仔细查验】

扩散语言模型强化训练突破，coupled-GRPO算法提升性能，苹果公司

思维必看！

国内动向*

递表港交所，C端效率类AI产品排名领先，合合信息【仔细查验】

上市冲刺，提交港交所申请，镁伽科技【仔细查验】

国外资讯：

谷歌重新开放AI搜索工具“Ask Photos”

有点意思~

AI音乐编辑工具突破，Suno收购WavTool强化功能，应对版权诉讼

海洋科技领域突破，“沧渊”大模型问世，提升海洋装备作业能力

法律争议突破，法院判决Anthropic部分行为侵权，AI训练版权纠纷

视频音效技术突破，实现音画同步，可灵AI“视频音效”功能上线

模型开源突破，降低部署成本，腾讯混元-A13B模型发布

企业估值突破，SpaceX登顶，全球独角兽榜单公布

多领域技术突破，涵盖模型开源、功能上线等，6月27日AI日报汇总

AI语音设计突破，文本提示生成拟人语音，ElevenLabs发布Voice Design v3

API模型突破，推出两款新模型助力深度研究，OpenAI发布Deep Research API新模型

游戏玩法突破，联合三大模型打造智能竞技，巨人网络《太空杀》上线“残局对决”

虚拟试穿技术突破，AI助力直观体验试穿效果，谷歌推出Doppl应用

开发者活动突破，预计吸引超1500人参与，OpenAI宣布2025年开发者大会举办信息

生成式AI冲击突破，影响SEO主导内容，谷歌搜索生成体验

AI功能优化突破，测试新功能，YouTube

AI创作辅助突破，引入大模型，知乎、微博

AI工具搭建突破，基于OpenAI API，多种实用工具

电视观看体验突破，电视端观看用户超手机，YouTube

虚拟试衣技术突破，上传照片即可体验，谷歌Doppl应用

AI助手革新突破，Gemini将取代Google助手，隐私保护升级

AI助手替代突破，Gemini取代Google助手，为Android用户带来新体验

视频创作变革突破，一键生成专业视频，HeyGen AI视频Agent

端侧AI性能突破，小体积实现云端能力，谷歌Gemma3n多模态模型

图像编辑模型突破，参数120亿性能强大且开源，FLUX.1 Kontext [dev]

API服务升级，开放深度研究模型且网页搜索降价，OpenAI

图像编辑技术突破，开源且功能强大可媲美GPT-4o，FLUX.1 Kontext [dev]

人才竞争升级，Meta挖走OpenAI顶级研究员，AI超级智能团队扩充

人才抢夺升级，Meta重金挖走OpenAI三大顶尖专家，发力AI领域

多模态RAG技术突破，统一理解复杂文档内容，港大RAG-Anything系统

代码图融合技术突破，提升代码任务处理能力，蚂蚁开源模型CGM

数学猜想验证突破，制成单稳四面体实物，建筑学者阿尔马迪

厨房机器人技术突破，获融资并取得食品经营许可证，享刻智能LAVA机器人

信息检索Agent突破，超越GPT-4o基准成绩，阿里WebDancer

蛋白质逆折叠技术突破，MapDiff框架提升预测精度，谢菲尔德大学与阿斯利康

智能体安全评估突破，AgentAuditor框架达人类评估水平，多校联合团队

请登录后发表评论

1【AI日报·6/28】测试中—2025刊

2【AI日报·6/26】生物医疗爆炸式突破，已效验—2025刊

3【AI日报·6/25】医疗,机器人,数据库突破。已校验—2025刊

4【AI日报·6/24】华为2025开发者大会，已校验—2025刊