【AI日报·6/25】医疗,机器人,数据库突破。已校验—2025刊

社群交流微信公众号图标

媒体矩阵联系我们图标

AI工具箱请求更新图标

栏目介绍

前言.

公告交流

日报解析

观感提醒

目前已经上线滴工具&板块：

【资讯类】省流日报；最新突破表；测试集整理；企业资讯；热点捕捉；优质活动；开源与产品；
【知识类】思维屋；AI必备知识
【评估类】横向测评；最新进程；AI社会改造；学术深思
【教学类】AI教学（签到免费）；AI多维板（学生党板块免费）
【实用类】金选工具箱

标签解析：

【伪人资讯】：向大家澄清资讯内容哪些是不真实的，没有时效性的，防止大家被外面的资讯误导。

【追踪】：我们会对仍然有疑问的资讯进行追踪，追踪的结果会在后面的省流日报公布。

板块解析：

【新的突破！】板块，由于心猿社还处于信息库建立的初级阶段，所以部分不算突破的突破有时也会划进去，这是因为心猿社对该领域信息库建立的还不完善的缘故。

有关超链接观感问题：您所看到的超链接（如心猿社）的实现是我们自己手搓的插件，目前还有许多需要优化的地方（比如白名单，黑名单功能等），所以有的地方视觉体验还不那么好，见谅呀。

新的突破！

医疗AI模型突破，MedBench排名第一，性能达三甲医院医师水平，讯飞星火医疗大模型 V2.5 国际版【仔细查验】

科大讯飞发布星火医疗大模型 V2.5 国际版，是唯一基于全国产算力训练的医疗大模型，在 MedBench 排名第一。该模型融合快思考与循证长思维链慢思考，提升全科诊疗和专科诊断推理能力，达三甲医院主治医师水平，且在完整性、实用性和可读性上优于人类医生。支持多语言，包括普通话、粤语和英语，拓展国际市场，推动全球医疗技术交流合作。【短评】国产算力，含金量很高。【注意】某些网址加载慢，打不开是因为魔法问题。【关联榜单】MedBench。

查看详情项目地址官网地址

AI数据库突破，成本降95%性能超ES9.0，支持SQL+AI混合检索，OB Cloud【仔细查验】

OceanBase发布云数据库OB Cloud，集成自研GPU加速向量引擎，单机支持10亿向量检索，同等性能下成本降低95%，通过SQL原生融合向量、标量、文本检索，已落地零售、物流等行业RAG场景，实现企业知识库智能问答与以图搜图等应用。【短评】主要提升的是：面对大规模的数据，更好的进行数据的检索，方便AI调用；核心采用的是“向量”技术，就是对你上传的文件进行处理，比如你上传了一张“鸽鸽穿背带裤打篮球”的图片，但是你的文件名是“114514”，那计算机肯定不知道这张图片是个啥——但经过AI多模态模型对图片的内容识别后，模型会对该图片打上一个标签：“男性”，“背带裤”，“篮球”，“唱跳rap”，这样计算机就充分了解了这张照片，等到AI调用时，这些特征就可以被AI检索进去。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情企业官网

人形机器人突破，讲句话就能控制动作，无需预训练，LeVERB框架【深度查验】

UC伯克利联合团队开发LeVERB框架，首次实现人形机器人视觉语义与全身控制闭环。宇树G1通过”坐黑箱””跨箱子”等语言指令，无需预训练即可完成复杂动作，简单导航任务零样本成功率80%。框架包含分层双系统（102.6M视觉语言模型+1.1M动作模型），配套LeVERB-Bench开源数据集含150+仿真任务，部署真实场景验证迁移能力。【短评】零样本就是指无需后续的训练和调整。好处：是训练出来后，通用性非常强；难点是：这意味着要让模型深刻理解世界的交互规律。说话就能控制动作，自然就需要一个“中继”（就像API接口一样），他们将其命名为“潜在动作词汇”，从而实现“理解任务”和“做好动作”的无缝衔接。这个看资讯就可以了，和论文讲述的差不多。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址论文地址

机器人突破，本地化运行，可进行供微调的VLA模型，谷歌Gemini Robotics On-Device【深度查验】

谷歌推出首个设备端视觉语言动作模型Gemini Robotics On-Device，支持本地低延迟推理，仅需50-100次演示即可让机器人学习拉开拉链、叠衣服等双手操作，适配机械臂、人形机器人等多形态，配套SDK助力开发者快速调优，被喻为“机器人安卓”。【短评】机器人方面，只有其采用的多模态模型方便横向对比，因此心猿社对其“突破”的要求就低些，只要是有创新，性能有提升，一般都会划入。【注意】某些网址加载慢，打不开是因为魔法问题。【关联榜单】ERQA。

查看详情论文地址

发烧友（学术深思）

通用AI长文本，8B小模型超越GPT-4o，ParallelComp【仔细查验】

香港大学团队提出ParallelComp，通过并行分块注意力+智能KV缓存淘汰，使8B模型在A100单卡实现128K长度推理，prefill加速23.5倍。实测在InfiniteBench基准上，8B模型整体性能达GPT-4o的91.17%，特定任务超越闭源大模型，代码已开源。【短评】就是用了更多方式来将注意力分散。分块淘汰：按每个块的 “信息量” 打分，只保留最重要的块。比如读小说时，扔掉无关的配角剧情，只留主线章节；KV 缓存淘汰：用算法动态评估每个单词的重要性，扔掉像 “的，了，吗” 这样的无效词记忆。注意力偏差校准：分层 “修剪” 异常关注的单词，让注意力分布更均匀。比如强制模型别只看开头，也要认真读中间章节。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址

港大开源GoT-R1：强化学习让多模态模型「先想后画」，复杂场景生成SOTA【仔细查验】

香港大学联合商汤发布GoT-R1，通过RL优化生成思维链（GoT），在T2I-CompBench基准的复杂组合任务中创SOTA。框架引入空间布局可视化奖励，使模型自主优化推理路径，经GPT-4o评估，其生成的推理链在空间关系任务中84%优于监督基线，代码已开源。【短评】将推理模型的能力融入到图像生成之前，这个其实就是一个更加复杂的提示词优化模型，再将“提示词”对应到图像生成模型中。这个不是简单的预设，他们是通过强化学习训练出了一个模型。当然，我说得很浅，有兴趣建议打开看一下。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址官网地址

北大团队首次量化AI组合创造力：GPT-4理解能力超普通人类【仔细查验】

北大认知科学团队提出IEI框架，首次从”识别-解释-引申”（认知科学）三层解析AI组合创造力。实验显示GPT-4在创意理解任务中准确率70%，超越普通人类（50%），但深层隐喻解读仍逊于专家（78%）。通过该框架优化的DALL-E 3生成质量提升35%，配套CreativeMashup数据集已开源，含艺术家创作的概念融合案例。【短评】论文主要就是阐述了短讯中所说的。【注意】某些网址加载慢，打不开是因为魔法问题。【学术深思】在AI语言大模型中的“边际效应”达到阈值后，我们终于向着更本质的东西：“认知科学”前进了。心猿社所构建的推演论，逻辑链工程便是心猿社对此所诠释的框架。

查看详情论文地址

字节跳动与上海交大推出 ProtoReasoning 框架，提升大语言模型逻辑推理【仔细查验】

字节跳动和上海交大团队推出 ProtoReasoning 框架，借助逻辑原型增强大语言模型推理能力，利用 Prolog 和 PDDL 等结构化原型表示，包含原型构建器和验证系统模块。经评估，该框架在逻辑推理、规划等基准测试中显著提升模型表现，基于 Prolog 的训练也验证了结构化原型训练的有效性，未来将深入探索推理原型理论基础。【短评】在AI大模型中有一个现象：AI模型在数学上训练后，竟然在逻辑推理甚至创意写作上也表现出色？他们首先假设：跨域泛化能力源于共享的抽象推理原型，然后以此假设构建了新的框架，并显著提高了模型表现。【注意】某些网址加载慢，打不开是因为魔法问题。【学术深思】这其实就揭示了人的思考方式在各个领域存在共性，实际上，这和心猿社所说的“意识数据”是一个逻辑，都是通过“混沌分析”来逐步接近本质。

查看详情论文地址

思维必看！

机器人顶会RSS 2025揭晓：伯克利团队开源MuJoCo Playground获杰出Demo奖

RSS 2025大会颁发年度奖项，UC伯克利联合DeepMind等机构的《Demonstrating MuJoCo Playground》斩获杰出Demo奖。该框架通过单GPU分钟级训练、多机器人平台兼容的开源方案，实现仿真到现实零样本迁移，支持人形/四足机器人、灵巧手等硬件，代码已开源（pip install即可部署）。【短评】里面讲述了许多，非常建议进去看看。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情

硅谷六大佬激辩AI就业：辛顿建议学修水管，哈萨比斯力挺STEM专业

“AI教父”辛顿预言初级脑力劳动将被替代，建议选择水管工等实操职业；DeepMind CEO哈萨比斯强调STEM（科学、技术、工程、数学）专业重要性，认为AI将创造高价值岗位；英伟达黄仁勋反对大规模失业论，称AI将开启创意新机遇，OpenAI阿尔特曼则警告智能体接管工作”未来不远”。

查看详情

开源与产品，

Claudia 横空出世！Claude Code 跨平台编程体验升级

Claudia 是一款为 Claude Code 打造的开源图形界面工具，基于 Tauri 跨平台框架，结合 React 前端和 Rust 后端。它以 “隐私优先、本地优先” 为理念，具备一站式项目管理、自定义 AI 智能体等亮点功能，为 Claude Code 用户带来从 CLI 到优雅桌面的跨越，其技术架构轻量高效且跨平台兼容性佳，有望不断扩展功能成为 AI 编程标杆工具。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址

国内动向*

首个系统评估多模态模型在三维空间理解方面的基准

由中国科学院自动化研究所推出，专注立体几何推理能力的 SolidGeo 基准给多模态大模型带来挑战。其数据集包含3113个高质量的立体几何问题，源自K-12教育和高中数学竞赛，配有图像和详细解答说明。实验显示，当前最强的OpenAI-o1模型在测试中准确率仅为49.5%，远低于人类的77.5%，揭示了AI模型在三维空间理解方面存在不足，未来需进一步提升大模型的空间推理能力。【注意】某些网址加载慢，打不开是因为魔法问题。【关联测试集】SolidGeo。

查看详情项目地址

Rokid Glasses 量产引爆市场，获 25 万台全球预售订单

近期，灵伴科技与蓝思科技联合开发的 Rokid Glasses 在蓝思科技湘潭基地正式下产线，实现规模化量产，且已获25万台全球预售订单，有望推动中国AI眼镜终端进入商业化爆发新阶段。这款眼镜整机重仅49克，外观接近普通眼镜，集成多项AI功能，如智能提词、实时翻译等，还支持创新交互方式。Rokid在操作系统等核心领域坚持自研，蓝思科技作为独家供应商提供核心组件及生产服务，双方还通过资本协同推动生态闭环建设。【短评】AR眼镜做到这么轻可不简单，而且还是100%的国产率，就是不知道价格和续航如何，说是解决了，但是估计悬。

查看详情

小米AI眼镜官宣：AI小爱实时问答+第一视角拍摄，雷军演示攀岩撸猫全场景记录

小米首款AI眼镜亮相，支持语音唤醒小爱同学实时识物（花种/宠物/食物热量），第一人称视角拍摄，覆盖运动、育儿、手工等20+场景，采用高通AR1+恒玄双芯片方案，供应链成本177.5美元，或定价1499元。【短评】重点是小米生态和拍摄状态下的续航，而且这个还是非屏幕款的，只能说慎重考虑，体验有限。

查看详情

奥比中光发布天工 Pro 机器人，搭载尖端深度相机【仔细查验】

奥比中光与北京人形机器人创新中心合作升级天工 Pro 机器人，其头部、胸部、腰部和后背配置 Gemini330 系列深度相机，增强感知能力与环境适应性。该深度相机利用深度感知和视觉识别技术，在工业自动化中发挥关键作用，尤其在智能物流和机器人领域表现卓越。此外，奥比中光还推出了 Gemini435Le 工业级双目视觉方案，具备长距高精度感知能力，为智能设备行业自动化和智能化发展助力。

查看详情机器人奥比中光

夸克应对志愿报告高峰，紧急扩容算力

随着高考成绩公布，志愿填报进入高峰期，夸克生成志愿报告出现排队等待现象。阿里巴巴集团副总裁吴嘉表示，截至当日 15:15，夸克系统已累计生成超 300 万份志愿报告，排队原因是多省份集中出分致需求爆发。夸克团队已紧急扩充算力，全力压缩等待时间，此前阿里已调配比去年多 100 倍的算力资源支持夸克，但部分高考大省出分时算力仍吃紧。【短评】这波营销，爽。

查看详情

支付宝推出国内首个 “AI 打赏” 服务助力开发者

支付宝宣布为 AI 开发者提供国内首个 “AI 打赏” 服务，首发上线蚂蚁百宝箱平台、阿里云百炼。开发者登录平台按两步操作即可开通，用户打赏金额直接入开发者账户，形成双向正反馈机制。此前支付宝推出的支付 MCP 与之结合，构成多元服务模式，推动 AI 技术商业化应用。

查看详情

国外资讯：

AI法律独角兽Harvey再融资3亿美元，4个月估值涨67%至50亿美元

法律大模型公司Harvey完成3亿美元E轮融资，估值50亿美元（4个月前D轮30亿）。客户覆盖全球337家机构（含顶级律所KKR、普华永道），年化营收7500万美元，通过私有数据微调+安全合规架构，将法律流程从周级缩短至分钟级，OpenAI、红杉连续四轮押注。【短评】国内，国家发布了法信法律基座大模型；此外，还有通义法睿。

查看详情

微软Win11内置AI助手Mu：一句话搞定系统设置，330M模型本地运行

微软为Win11设置界面植入自研轻量模型Mu（330M），支持自然语言指令直接调用系统功能，如”鼠标指针太小”可一键调大。模型采用编码器-解码器架构，通过NPU优化实现500ms内响应，性能接近3.5B参数的Phi模型，首批支持骁龙芯片的Copilot+PC设备，后续将扩展至AMD/Intel平台。

查看详情

有点意思~

奥特曼晒邮件反击IYO抄袭指控：收购未果反遭诉讼

OpenAI创始人奥特曼公开与IYO CEO往来邮件，揭露对方多次求收购未果后提起商标诉讼。邮件显示IYO曾主动演示产品、寻求1000万美元投资及联合开发，甚至在OpenAI宣布收购IO团队两天后仍提议合作。法院此前已临时禁止OpenAI使用IO名称，双方围绕产品定位（IYO定制耳戴设备 vs IO非穿戴设备）和技术差异持续交锋。【短评】打起来，打起来！

查看详情

文章版权归作者所有，未经允许请勿转载。

THE END

AI省流日报

【AI日报·6/25】医疗,机器人,数据库突破。已校验—2025刊

前言.

新的突破！

医疗AI模型突破，MedBench排名第一，性能达三甲医院医师水平，讯飞星火医疗大模型 V2.5 国际版【仔细查验】

AI数据库突破，成本降95%性能超ES9.0，支持SQL+AI混合检索，OB Cloud【仔细查验】

人形机器人突破，讲句话就能控制动作，无需预训练，LeVERB框架【深度查验】

机器人突破，本地化运行，可进行供微调的VLA模型，谷歌Gemini Robotics On-Device【深度查验】

发烧友（学术深思）

通用AI长文本，8B小模型超越GPT-4o，ParallelComp【仔细查验】

港大开源GoT-R1：强化学习让多模态模型「先想后画」，复杂场景生成SOTA【仔细查验】

北大团队首次量化AI组合创造力：GPT-4理解能力超普通人类【仔细查验】

字节跳动与上海交大推出 ProtoReasoning 框架，提升大语言模型逻辑推理【仔细查验】

思维必看！

机器人顶会RSS 2025揭晓：伯克利团队开源MuJoCo Playground获杰出Demo奖

硅谷六大佬激辩AI就业：辛顿建议学修水管，哈萨比斯力挺STEM专业

开源与产品，

Claudia 横空出世！Claude Code 跨平台编程体验升级

国内动向*

首个系统评估多模态模型在三维空间理解方面的基准

Rokid Glasses 量产引爆市场，获 25 万台全球预售订单

小米AI眼镜官宣：AI小爱实时问答+第一视角拍摄，雷军演示攀岩撸猫全场景记录

奥比中光发布天工 Pro 机器人，搭载尖端深度相机【仔细查验】

夸克应对志愿报告高峰，紧急扩容算力

支付宝推出国内首个 “AI 打赏” 服务助力开发者

国外资讯：

AI法律独角兽Harvey再融资3亿美元，4个月估值涨67%至50亿美元

微软Win11内置AI助手Mu：一句话搞定系统设置，330M模型本地运行

有点意思~

奥特曼晒邮件反击IYO抄袭指控：收购未果反遭诉讼

请登录后发表评论

1【AI日报·6/28】测试中—2025刊

2【AI日报·6/26】生物医疗爆炸式突破，已效验—2025刊

3【AI日报·6/25】医疗,机器人,数据库突破。已校验—2025刊

4【AI日报·6/24】华为2025开发者大会，已校验—2025刊