北大团队首次量化AI组合创造力:GPT-4理解能力超普通人类
北大认知科学团队提出IEI框架,首次从”识别-解释-引申”三层解析AI组合创造力。实验显示GPT-4在创意理解任务中准确率70%,超越普通人类(50%),但深层隐喻解读仍逊于专家(78%)。通过该框架优化的DALL-E 3生成质量提升35%,配套CreativeMashup数据集已开源,含艺术家创作的概念融合案例。
微软Win11内置AI助手Mu:一句话搞定系统设置,330M模型本地运行
微软为Win11设置界面植入自研轻量模型Mu(330M),支持自然语言指令直接调用系统功能,如”鼠标指针太小”可一键调大。模型采用编码器-解码器架构,通过NPU优化实现500ms内响应,性能接近3.5B参数的Phi模型,首批支持骁龙芯片的Copilot+PC设备,后续将扩展至AMD/Intel平台。
UC伯克利华人团队让宇树G1零样本执行指令:视觉语言驱动全身动作
UC伯克利联合团队开发LeVERB框架,首次实现人形机器人视觉语义与全身控制闭环。宇树G1通过”坐黑箱””跨箱子”等语言指令,无需预训练即可完成复杂动作,简单导航任务零样本成功率80%。框架包含分层双系统(102.6M视觉语言模型+1.1M动作模型),配套LeVERB-Bench开源数据集含150+仿真任务,部署真实场景验证迁移能力。
机器人顶会RSS 2025揭晓:伯克利团队开源MuJoCo Playground获杰出Demo奖
RSS 2025大会颁发年度奖项,UC伯克利联合DeepMind等机构的《Demonstrating MuJoCo Playground》斩获杰出Demo奖。该框架通过单GPU分钟级训练、多机器人平台兼容的开源方案,实现仿真到现实零样本迁移,支持人形/四足机器人、灵巧手等硬件,代码已开源(pip install即可部署)。
8B模型突破:港大ParallelComp实现128K长文本推理,显存压缩95%超越GPT-4o
香港大学团队提出ParallelComp,通过并行分块注意力+智能KV缓存淘汰,使8B模型在A100单卡实现128K长度推理,prefill加速23.5倍。实测在InfiniteBench基准上,8B模型整体性能达GPT-4o的91.17%,特定任务超越闭源大模型,代码已开源。
港大开源GoT-R1:强化学习让多模态模型「先想后画」,复杂场景生成SOTA
香港大学联合商汤发布GoT-R1,通过RL优化生成思维链(GoT),在T2I-CompBench基准的复杂组合任务中创SOTA。框架引入空间布局可视化奖励,使模型自主优化推理路径,经GPT-4o评估,其生成的推理链在空间关系任务中84%优于监督基线,代码已开源。
OceanBase推GPU向量数据库:成本降95%,性能超ES9.0 16%,支持10亿级向量检索
蚂蚁集团OceanBase发布云数据库OB Cloud,集成自研GPU向量引擎,在1536维500K数据集上,同等召回率下成本仅为开源方案1/20,性能超ES9.0 16%。支持分布式亿级向量检索,结合SQL原生AI能力,已落地零售(银泰)、物流(货拉拉)等行业RAG场景。
Rokid Glasses 量产引爆市场,获 25 万台全球预售订单
近期,灵伴科技与蓝思科技联合开发的 Rokid Glasses 在蓝思科技湘潭基地正式下产线,实现规模化量产,且已获25万台全球预售订单,有望推动中国AI眼镜终端进入商业化爆发新阶段。这款眼镜整机重仅49克,外观接近普通眼镜,集成多项AI功能,如智能提词、实时翻译等,还支持创新交互方式。Rokid在操作系统等核心领域坚持自研,蓝思科技作为独家供应商提供核心组件及生产服务,双方还通过资本协同推动生态闭环建设。
Harvey AI 获3亿美元 E 轮融资,估值达50亿美元
成立仅三年的Harvey AI专注于法律工作自动化,日前完成3亿美元的 E 轮融资,估值飙升至50亿美元。这轮融资由 Kleiner Perkins 和 Coatue 共同主导,现有投资者红杉资本等也参与其中。该公司计划利用资金将员工人数从340人翻倍,并拓展至税务会计等专业服务领域,目前已有337家法律客户,预计年化收入7500万美元。
Wispr Flow 获3000万美元A轮融资,致力于语音 AI 研发
语音输入技术初创公司Wispr Flow完成3000万美元的A轮融资,由Menlo Ventures领投,NEA、8VC等跟投,累计融资达5600万美元。其核心产品“Flow”支持超100种语言输入,能自动编辑口语冗余并适配用户写作风格。公司计划用于团队扩张、跨平台扩展及AI硬件合作,正开发Android版本并计划推出企业级解决方案,自2024年10月发布macOS应用后,用户增长强劲。
Claudia 横空出世!Claude Code 跨平台编程体验升级
Claudia 是一款为 Claude Code 打造的开源图形界面工具,基于 Tauri 跨平台框架,结合 React 前端和 Rust 后端。它以 “隐私优先、本地优先” 为理念,具备一站式项目管理、自定义 AI 智能体等亮点功能,为 Claude Code 用户带来从 CLI 到优雅桌面的跨越,其技术架构轻量高效且跨平台兼容性佳,有望不断扩展功能成为 AI 编程标杆工具。
奥比中光发布天工 Pro 机器人,搭载尖端深度相机
奥比中光与北京人形机器人创新中心合作升级天工 Pro 机器人,其头部、胸部、腰部和后背配置 Gemini330 系列深度相机,增强感知能力与环境适应性。该深度相机利用深度感知和视觉识别技术,在工业自动化中发挥关键作用,尤其在智能物流和机器人领域表现卓越。此外,奥比中光还推出了 Gemini435Le 工业级双目视觉方案,具备长距高精度感知能力,为智能设备行业自动化和智能化发展助力。
前言.
新的突破!
医疗AI模型突破,MedBench排名第一,性能达三甲医院医师水平,讯飞星火医疗大模型 V2.5 国际版【仔细查验】
科大讯飞发布星火医疗大模型 V2.5 国际版,是唯一基于全国产算力训练的医疗大模型,在 MedBench 排名第一。该模型融合快思考与循证长思维链慢思考,提升全科诊疗和专科诊断推理能力,达三甲医院主治医师水平,且在完整性、实用性和可读性上优于人类医生。支持多语言,包括普通话、粤语和英语,拓展国际市场,推动全球医疗技术交流合作。
AI数据库突破,成本降95%性能超ES9.0,支持SQL+AI混合检索,OB Cloud【仔细查验】
OceanBase发布云数据库OB Cloud,集成自研GPU加速向量引擎,单机支持10亿向量检索,同等性能下成本降低95%,通过SQL原生融合向量、标量、文本检索,已落地零售、物流等行业RAG场景,实现企业知识库智能问答与以图搜图等应用。
发烧友(学术深思)
字节跳动与上海交大推出 ProtoReasoning 框架,提升大语言模型逻辑推理【仔细查验】
字节跳动和上海交大团队推出 ProtoReasoning 框架,借助逻辑原型增强大语言模型推理能力,利用 Prolog 和 PDDL 等结构化原型表示,包含原型构建器和验证系统模块。经评估,该框架在逻辑推理、规划等基准测试中显著提升模型表现,基于 Prolog 的训练也验证了结构化原型训练的有效性,未来将深入探索推理原型理论基础。
思维必看!
硅谷六大佬激辩AI就业:辛顿建议学修水管,哈萨比斯力挺STEM专业
“AI教父”辛顿预言初级脑力劳动将被替代,建议选择水管工等实操职业;DeepMind CEO哈萨比斯强调STEM(科学、技术、工程、数学)专业重要性,认为AI将创造高价值岗位;英伟达黄仁勋反对大规模失业论,称AI将开启创意新机遇,OpenAI阿尔特曼则警告智能体接管工作”未来不远”。
国内动向*
小米AI眼镜官宣:AI小爱实时问答+第一视角拍摄,雷军演示攀岩撸猫全场景记录
小米首款AI眼镜亮相,支持语音唤醒小爱同学实时识物(花种/宠物/食物热量),第一人称视角拍摄,覆盖运动、育儿、手工等20+场景,采用高通AR1+恒玄双芯片方案,供应链成本177.5美元,或定价1499元。
夸克应对志愿报告高峰,紧急扩容算力
随着高考成绩公布,志愿填报进入高峰期,夸克生成志愿报告出现排队等待现象。阿里巴巴集团副总裁吴嘉表示,截至当日 15:15,夸克系统已累计生成超 300 万份志愿报告,排队原因是多省份集中出分致需求爆发。夸克团队已紧急扩充算力,全力压缩等待时间,此前阿里已调配比去年多 100 倍的算力资源支持夸克,但部分高考大省出分时算力仍吃紧。
支付宝推出国内首个 “AI 打赏” 服务助力开发者
支付宝宣布为 AI 开发者提供国内首个 “AI 打赏” 服务,首发上线蚂蚁百宝箱平台、阿里云百炼。开发者登录平台按两步操作即可开通,用户打赏金额直接入开发者账户,形成双向正反馈机制。此前支付宝推出的支付 MCP 与之结合,构成多元服务模式,推动 AI 技术商业化应用。
暂无评论内容