前言.
新的突破!
AI数据库突破,成本降95%性能超ES9.0,支持SQL+AI混合检索,OB Cloud【仔细查验】
OceanBase发布云数据库OB Cloud,集成自研GPU加速向量引擎,单机支持10亿向量检索,同等性能下成本降低95%,通过SQL原生融合向量、标量、文本检索,已落地零售、物流等行业RAG场景,实现企业知识库智能问答与以图搜图等应用。
人形机器人突破,讲句话就能控制动作,无需预训练,LeVERB框架【深度查验】
UC伯克利联合团队开发LeVERB框架,首次实现人形机器人视觉语义与全身控制闭环。宇树G1通过”坐黑箱””跨箱子”等语言指令,无需预训练即可完成复杂动作,简单导航任务零样本成功率80%。框架包含分层双系统(102.6M视觉语言模型+1.1M动作模型),配套LeVERB-Bench开源数据集含150+仿真任务,部署真实场景验证迁移能力。
发烧友(学术深思)
通用AI长文本,8B小模型超越GPT-4o,ParallelComp【仔细查验】
香港大学团队提出ParallelComp,通过并行分块注意力+智能KV缓存淘汰,使8B模型在A100单卡实现128K长度推理,prefill加速23.5倍。实测在InfiniteBench基准上,8B模型整体性能达GPT-4o的91.17%,特定任务超越闭源大模型,代码已开源。
港大开源GoT-R1:强化学习让多模态模型「先想后画」,复杂场景生成SOTA【仔细查验】
香港大学联合商汤发布GoT-R1,通过RL优化生成思维链(GoT),在T2I-CompBench基准的复杂组合任务中创SOTA。框架引入空间布局可视化奖励,使模型自主优化推理路径,经GPT-4o评估,其生成的推理链在空间关系任务中84%优于监督基线,代码已开源。
北大团队首次量化AI组合创造力:GPT-4理解能力超普通人类【仔细查验】
北大认知科学团队提出IEI框架,首次从”识别-解释-引申”(认知科学)三层解析AI组合创造力。实验显示GPT-4在创意理解任务中准确率70%,超越普通人类(50%),但深层隐喻解读仍逊于专家(78%)。通过该框架优化的DALL-E 3生成质量提升35%,配套CreativeMashup数据集已开源,含艺术家创作的概念融合案例。
字节跳动与上海交大推出 ProtoReasoning 框架,提升大语言模型逻辑推理【仔细查验】
字节跳动和上海交大团队推出 ProtoReasoning 框架,借助逻辑原型增强大语言模型推理能力,利用 Prolog 和 PDDL 等结构化原型表示,包含原型构建器和验证系统模块。经评估,该框架在逻辑推理、规划等基准测试中显著提升模型表现,基于 Prolog 的训练也验证了结构化原型训练的有效性,未来将深入探索推理原型理论基础。
思维必看!
机器人顶会RSS 2025揭晓:伯克利团队开源MuJoCo Playground获杰出Demo奖
RSS 2025大会颁发年度奖项,UC伯克利联合DeepMind等机构的《Demonstrating MuJoCo Playground》斩获杰出Demo奖。该框架通过单GPU分钟级训练、多机器人平台兼容的开源方案,实现仿真到现实零样本迁移,支持人形/四足机器人、灵巧手等硬件,代码已开源(pip install即可部署)。
开源与产品,
国内动向*
Rokid Glasses 量产引爆市场,获 25 万台全球预售订单
近期,灵伴科技与蓝思科技联合开发的 Rokid Glasses 在蓝思科技湘潭基地正式下产线,实现规模化量产,且已获25万台全球预售订单,有望推动中国AI眼镜终端进入商业化爆发新阶段。这款眼镜整机重仅49克,外观接近普通眼镜,集成多项AI功能,如智能提词、实时翻译等,还支持创新交互方式。Rokid在操作系统等核心领域坚持自研,蓝思科技作为独家供应商提供核心组件及生产服务,双方还通过资本协同推动生态闭环建设。
小米AI眼镜官宣:AI小爱实时问答+第一视角拍摄,雷军演示攀岩撸猫全场景记录
小米首款AI眼镜亮相,支持语音唤醒小爱同学实时识物(花种/宠物/食物热量),第一人称视角拍摄,覆盖运动、育儿、手工等20+场景,采用高通AR1+恒玄双芯片方案,供应链成本177.5美元,或定价1499元。
奥比中光发布天工 Pro 机器人,搭载尖端深度相机【仔细查验】
奥比中光与北京人形机器人创新中心合作升级天工 Pro 机器人,其头部、胸部、腰部和后背配置 Gemini330 系列深度相机,增强感知能力与环境适应性。该深度相机利用深度感知和视觉识别技术,在工业自动化中发挥关键作用,尤其在智能物流和机器人领域表现卓越。此外,奥比中光还推出了 Gemini435Le 工业级双目视觉方案,具备长距高精度感知能力,为智能设备行业自动化和智能化发展助力。
夸克应对志愿报告高峰,紧急扩容算力
随着高考成绩公布,志愿填报进入高峰期,夸克生成志愿报告出现排队等待现象。阿里巴巴集团副总裁吴嘉表示,截至当日 15:15,夸克系统已累计生成超 300 万份志愿报告,排队原因是多省份集中出分致需求爆发。夸克团队已紧急扩充算力,全力压缩等待时间,此前阿里已调配比去年多 100 倍的算力资源支持夸克,但部分高考大省出分时算力仍吃紧。
支付宝推出国内首个 “AI 打赏” 服务助力开发者
支付宝宣布为 AI 开发者提供国内首个 “AI 打赏” 服务,首发上线蚂蚁百宝箱平台、阿里云百炼。开发者登录平台按两步操作即可开通,用户打赏金额直接入开发者账户,形成双向正反馈机制。此前支付宝推出的支付 MCP 与之结合,构成多元服务模式,推动 AI 技术商业化应用。
国外资讯:
微软Win11内置AI助手Mu:一句话搞定系统设置,330M模型本地运行
微软为Win11设置界面植入自研轻量模型Mu(330M),支持自然语言指令直接调用系统功能,如”鼠标指针太小”可一键调大。模型采用编码器-解码器架构,通过NPU优化实现500ms内响应,性能接近3.5B参数的Phi模型,首批支持骁龙芯片的Copilot+PC设备,后续将扩展至AMD/Intel平台。
暂无评论内容