【AI日报·6/26】测试中—2025刊

AI工具突破,动态结构化工具增强推理,OctoTools框架开源

中国DeepSeek公司于2月24日发布并开源OctoTools框架,这是一个模块化、无需训练且可扩展的框架,旨在通过动态、结构化的外部工具使用来增强AI的推理能力,推进AI模型与外部工具交互方式的标准化。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

国防AI突破,战场数据处理能力测试,GeDAI系统验证

韩国国防部在韩美“2025自由之盾”联合演习上测试生成式国防人工智能(GeDAI)处理战场数据的能力,以验证该系统用于战时任务的可行性。演习还将收集战场数据,训练GeDAI快速准确进行战场态势感知并做出指挥决策,以提高战时效率。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

大模型加速器突破,专为英伟达Hopper GPU打造,FlashMLA发布

中国DeepSeek公司于2月24日正式发布并开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper GPU打造的大模型加速器,旨在提升模型在特定硬件上的运行效率和性能。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI医疗普惠突破,支持50种皮肤疾病识别+百万医生连接,蚂蚁健康管家AQ上线

蚂蚁集团发布AI健康应用AQ,集成医疗大模型实现症状追问、报告拍照解读,连接全国5000家医院/百万医生,200位三甲名医AI分身7×24小时服务,单日单医生AI分身最高接诊11万人次,支持华为/苹果等可穿戴设备数据联动,已覆盖超7000万用户。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI创作门槛突破,文本+素材一键生成动态视频,Vibemotion零代码平台开放

创新公司Vibemotion推出AI动态图形平台,用户输入文本提示+上传素材即可生成专业级动态视频,支持16:9/9:16多比例输出,覆盖广告/教育/社交媒体场景,当前采用等候名单制开放,吸引超10万创作者预约。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI教育模式突破,真互动1对1+国际教材,新东方AI1对1七月上线

新东方发布首款AI教育产品“AI1对1S体系原版营”,融合国家地理《LOOK看世界》、外研社《TH!NK》教材,AI老师模拟真实教学场景,支持高频互动问答与学习反馈,7月2日通过“新东方一点一看”APP开放,目标实现英语能力从输入到输出的转化。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI志愿填报突破,三线城市占比48%,夸克深度搜索日均服务千万考生

夸克高考数据显示,高考出分三天内生成500万份AI志愿报告,三线及以下城市需求占比48%,单考生平均使用4次深度搜索。其“志愿报告”智能Agent可识别分数/选科/职业倾向,生成含录取概率、专业分析的专家级建议,单日最高处理250万份请求。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

工具性能突破,Rust重构提升50%运行效率,OpenAI Codex CLI

OpenAI放弃TypeScript,全面转向Rust重构Codex CLI,安装门槛从Node v22降至原生支持,内存消耗减少40%,新增多语言插件协议。开发者反馈“原生运行顺畅”,目标从终端工具转型为智能代理开发平台。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

文生图技术突破,2K分辨率文本渲染无错,谷歌Imagen4

谷歌发布Imagen4文生图模型,文本渲染准确率提升70%,支持2K分辨率与10倍速快速模式,新增SynthID水印防滥用。Imagen4 Ultra版精准对齐广告级需求,API调用单价0.04-0.06美元,已开放企业试用。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI安全突破,全自动检测1060个漏洞,XBOW登顶HackerOne

XBOW AI工具在HackerOne平台提交1060个漏洞(132个高危),首次超越人类研究员登顶美国榜,检测范围覆盖RCE、SQL注入等6类漏洞,误报率低于行业均值45%。获7500万美元B轮融资,计划8月公开核心技术。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

生命科学突破,秒级解析百万碱基变异,谷歌AlphaGenome

DeepMind推出AlphaGenome,支持单次分析100万个DNA碱基,1秒内评估基因突变对8类分子特性的影响,覆盖细胞类型、基因剪接等多维度预测。基于Transformer+TPU架构,已接入API供全球科研团队加速新药研发。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

iOS应用下载突破,2960万超越四大社交总和,ChatGPT

ChatGPT iOS应用过去28天下载2960万次,首次超越TikTok等四大社交应用总和(3290万),差距10.6%,月活用户达6亿(Gemini 3.5亿),但66%美国成年人仍未使用。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

开发者工具突破,100万token+代码助手整合,谷歌Gemini CLI

谷歌发布Gemini CLI命令行工具,支持100万token上下文窗口,深度整合代码助手,提供每分钟60次/每日1000次免费配额,覆盖编程、内容生成等多场景。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

合作关系突破,股权条款谈判悬而未决,OpenAI+微软

OpenAI CEO奥特曼与微软纳德拉通话讨论股权修改,若分歧未解可能暂停谈判,双方合作影响AI市场格局,涉及5000亿美元“星际之门”项目。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

隐私功能突破,AI摘要+安全云环境,WhatsApp

WhatsApp推AI消息摘要功能,用Meta AI生成未读内容总结,默认关闭且支持隐私隔离,用户可阻止群聊AI,但准确性存疑,此前因广告和强制按钮引发争议。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

数据安全突破,谷歌文档泄露客户机密,Scale AI

Scale AI被曝用公开谷歌文档存储Meta、谷歌等客户绝密信息(含700个xAI训练提示),暴露85份敏感文件,含员工薪资细节,客户已启动业务切割。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

CLI性能突破,Rust重构+多语言扩展,OpenAI Codex

OpenAI放弃TypeScript重构Codex CLI为Rust版本,实现安装简化(无需Node.js)、内存降耗50%,并新增多语言插件协议,支持TS/Python扩展,目标从工具转向可编程智能代理,开发者反馈“原生运行更流畅”。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

文生图精度突破,2K文本渲染+SynthID水印,谷歌Imagen4

谷歌发布Imagen4文生图模型,文本渲染准确率提升70%,支持2K分辨率及10倍速“快速模式”,新增Imagen4Ultra高精度版(0.06美元/张),强制嵌入SynthID水印防伪造,已开放Gemini API付费预览。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

漏洞检测突破,千余漏洞登顶HackerOne,XBOW AI

XBOW自主AI工具首次超越人类,登顶HackerOne美国漏洞榜(提交1060个,132个确认),覆盖RCE/XSS等12类漏洞,检测效率超人工20倍,获7500万美元B轮融资,主打“黑盒自动化渗透测试”,客户包括迪士尼、福特。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

基因预测突破,百万碱基秒级分析,谷歌AlphaGenome

DeepMind推出AlphaGenome,支持单次分析100万个DNA碱基,毫秒级预测基因突变对8类分子特性的影响(如RNA生成、剪接位点),通过TPU集群实现长序列+高分辨率平衡,已开放API助力新疗法研发。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

全球首部AIGC单元剧首映,创作需“反复抽卡”调优,可灵AI《新世界加载中》

快手可灵AI联合星芒短剧推出7部单元剧《新世界加载中》,融合科幻/历史/奇幻题材,通过首尾帧技术实现流畅打斗,但存在角色一致性不足、人脸失真问题。可灵AI负责人李杨称当前需反复调试提示词,专业创作者主导用户池,商业化ARR超1亿美元,团队聚焦运动表现与语义遵从优化。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

Gemini CLI开源免费,100万token挑战编程工具,谷歌掀AI开发革命

谷歌发布开源终端工具Gemini CLI,提供免费Gemini2.5Pro模型(100万token上下文),集成搜索/多模态创作,支持“橘猫冒险短视频”生成,日免费1000次请求颠覆Cursor等付费工具。依托自研芯片成本优势,欲重定义AI编程标准,GitHub获9000+星标。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

豆包AI高考达清北线,文科683分领跑多模态推理,字节Seed团队

字节豆包Seed1.6模型在2025高考中获文科683分(清北线)、理科648分,语文/英语等6科登顶,图文交织测试显示化学/生物提分近30分,验证全模态推理优势。对比Gemini2.5Pro等模型,豆包展现复杂评分体系适应力,标志国产AI综合认知达国际先进。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

Getty撤诉Stability AI核心指控,17亿索赔转向商标纠纷,版权战缩围

图片巨头Getty撤回对Stability AI的训练/输出侵权指控(英国),保留次级侵权及商标诉讼,美国索赔仍达17亿美元。法律专家指证据不足导致撤诉,Stable Diffusion水印争议转向消费者认知判定。Getty同步推自研AIGC工具,利用自有图库训练可授权模型。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

Ring智能设备推AI事件描述,运动识别升级引隐私争议

亚马逊旗下Ring为门铃/摄像头加入AI运动事件描述功能(如“带黑狗的人上台阶”),首批向美加付费用户测试,支持禁用。尽管提升安防精度,但“学习用户习惯”的未来功能引发隐私担忧,此前Ring曾因数据问题受争议。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

谷歌开源Gemini CLI,百万token免费终端AI代理赋能开发者

谷歌发布轻量开源工具Gemini CLI,基于Gemini2.5Pro模型,支持100万token上下文、每日1000次免费调用,集成搜索/插件/多模态(代码/视频/图像),主打终端自动化与开发提效,代码能力虽逊Claude但胜在免费开源。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

Altman硬刚《纽约时报》版权诉讼:宁拒数据保留,不妥协用户隐私

OpenAI CEO回应《纽约时报》训练数据侵权案,拒绝其“保留所有用户聊天记录”的诉求,强调“私密模式下数据必须删除”。同时承认与微软合作摩擦,但称竞争不影响长期价值,另披露正优化ChatGPT自杀/阴谋论内容干预机制。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI硬件突破,Shadow AI赋能随身记录,出门问问TicNote

出门问问推出内置Shadow AI的TicNote录音设备,支持40+场景模板、20小时续航及120种语言转写,通过主动洞察、思维导图和项目管理功能,定位随身AI思考伙伴,已上架国内电商。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

版权诉讼升级,20万盗版书训练模型,微软遭作家索赔

微软因使用近20万本盗版书籍训练Megatron模型,被凯·伯德等作家起诉,索赔单部作品最高15万美元,争议聚焦AI训练的“合理使用”边界,涉及Meta、Anthropic等公司。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

用户隐私对峙,拒存私密聊天记录,OpenAI回应时报诉讼

OpenAI CEO奥尔特曼反对《纽约时报》要求保留用户私密数据的主张,强调“用户删除即清除”原则,同时承认与微软合作存在摩擦,但坚持长期价值,案件关联大模型训练版权争议。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

机器人营收破十亿,9年从一人到巨头,宇树科技亮相达沃斯

宇树科技创始人王兴兴在天津达沃斯透露,公司从2016年“一人公司”成长为年营收10亿元、近千员工的机器人企业,展现国产机器人硬件规模化突破,未披露具体产品线细节。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI训练版权突破,美法院首认合法使用已购书籍,Anthropic胜诉

美国法院裁定Anthropic可未经授权使用合法购买书籍训练AI,认定AI训练属“转化性使用”,不替代原作市场。但盗版书籍使用仍涉侵权,需另案处理。此案为美国首起认可AI训练合理使用的判决,降低行业数据合规风险。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

智能体硬件突破,卡片式TicNote支持256K长上下文,出门问问发布随身AI伙伴

出门问问推出全球首款卡片式智能体硬件TicNote(999元起),集成64GB离线录音、20天续航,搭载Shadow AI实现录音转写(98%准确率)、思维导图生成、深度研究等功能。实测支持OpenAI访谈分析,自动提取GPT-5发布时间等细节,定位“随身思考伙伴”。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

大模型高考突破,豆包文科683分领跑,字节Seed 1.6模型首秀

字节Seed团队发布大模型高考成绩单:豆包-Seed-1.6文科683分(语文128+文综270)、理科648分,超越Gemini等模型。技术亮点包括256K长上下文、多模态融合推理,数学压轴题正确率超90%,但图文混合题仍存短板。山东卷赋分后有望冲刺清北。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

向量数据库突破,OB Cloud支持十亿级多模态数据,银泰/携程等企业落地

OceanBase宣布OB Cloud支持十亿级文本/图像向量检索,一体化架构融合事务/分析/AI负载,在银泰“智能问数”、携程“以图搜图”等场景实现秒级响应。伯俊科技基于OB Cloud构建AI通识助手,库存调度效率提升60%,降低企业RAG部署成本80%。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

学术产业突破,MIT终身教授何恺明加盟DeepMind,任杰出科学家

MIT新晋终身教授何恺明(ResNet作者)兼任谷歌DeepMind杰出科学家,此前已合作发表分形生成模型等成果。其MIT团队近期提出“无需训练的压缩Tokenizer生成文本”等创新,累计引用超71万次。此次兼职或推动CV与大模型技术融合,探索生成模型新范式。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

通用生物医学AI突破,跨25领域自主生成研究流程,斯坦福Biomni

斯坦福联合基因泰克等开发Biomni,整合150+专业工具/105软件/59数据库,通过LLM推理+代码执行实现零样本泛化,成功设计基因克隆实验方案(湿实验验证100%正确),分析458份可穿戴数据发现餐后体温变化规律。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

科研智能体评测突破,首现真实科研环境自动化评估,香港大学ScienceBoard

香港大学团队构建ScienceBoard,集成ChimeraX/Celestia等6领域科研软件,设计169项多模态任务(含跨软件工作流),测试显示GPT-4o等模型平均成功率仅15%,暴露规划与执行断层问题,为AI科研助手提供首个可复现基准。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

计算机视觉顶会突破,ICCV 2025投稿1.1万+录用24%,引入审稿人问责制

ICCV 2025录取2699篇(录用率24%),投稿量较2019年增长160%,首次因25名”不负责任审稿人”直接拒稿29篇(含12篇本可录用论文),引发学界对评审公平性争议。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

AI人才争夺突破,Meta挖走ViT三作者,OpenAI苏黎世团队”团灭”

MetaCEO扎克伯格挖角OpenAI苏黎世办公室核心成员——ViT论文作者Beyer/Kolesnikov/翟晓华,三人曾主导Google DeepMind视觉Transformer研发,此次加入Meta超级智能实验室,或重塑多模态AI竞争格局。 【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

郑州AI产业政策突破,2000亿规模+DeepSeek政务接入,三年行动方案出炉

郑州市政府发布《2025-2027场景驱动AI创新方案》,计划2025年AI核心产业超350亿、相关产业破2000亿,开放政务系统接入DeepSeek大模型,打造医疗/工业等20个深度场景,扩容国家超算中心构建算力网。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

医疗AI融资突破,Abridge获3亿美元估值53亿,年内支持5000万次医患对话

美国医疗AI公司Abridge完成3亿美元融资(估值53亿美元),其环境监听技术已部署150家卫生系统,通过实时医患对话生成临床记录,本轮资金将拓展AI辅助医疗编码业务,降低保险拒付风险,计划年内覆盖超5000万次对话。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

编程AI工具突破,谷歌开源Gemini CLI,免费1000次/天硬刚代码助手

谷歌发布开源工具Gemini CLI,集成Gemini大模型能力,支持自然语言编程、代码调试及多任务管理,提供个人账号免费额度(1000次/天),通过VS Code智能体模式实现测试编写、错误修复全流程辅助,代码开源社区共建。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

基因AI模型突破,AlphaGenome百万碱基预测,24项基准超现有技术

谷歌DeepMind推出AlphaGenome,以百万碱基DNA序列为输入,单碱基分辨率预测20+基因调控特性,在24/26项变异效应基准中超越最优模型,支持秒级变异评分,覆盖基因表达、剪接等多模态,助力癌症机制研究及合成生物学。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

生物电子技术突破,哈佛胚胎植入网,《Nature》封面实现脑发育全周期记录

哈佛大学开发亚微米级柔软电子网,植入非洲爪蟾胚胎神经板,随神经管三维发育自然整合,在蝌蚪脑内实现单神经元电活动连续追踪,弹性模量匹配脑组织(0.1-1kPa),支持5天以上全脑动态记录,为神经发育研究提供无创工具。【短评】【注意】某些网址加载慢,打不开是因为魔法问题。

前言.

今日更新:

目前已经上线滴工具&板块:

标签解析:

【伪人资讯】:虽然心猿社对资讯的真实性,时效性,广告问题已经做了初步的人工筛选,但仍然有社会影响大的,内容存在虚假的资讯存在,这样的资讯我们会标注上“伪人资讯”,目的是进行澄清,防止大家被外面的资讯误导。

【仔细查验】:每一篇资讯心猿社都会继续人工查验,其中,我们认为要仔细核实,或者是要仔细阅读来帮助大家阅读的资讯,心猿社会进行“仔细查验”。

【追踪】:心猿社会对仍然有疑问的资讯进行追踪,追踪出现结果,心猿社会在后面的省流日报公布。

板块解析:

【产品突破】和【研究突破】:由于心猿社还处于信息库建立的初级阶段,所以部分不算突破的突破有时也会划进去,这是因为心猿社对该领域信息库建立的还不完善的缘故。

学术深思】:依据心猿社理论体系,对资讯进行延伸解读。

有关超链接观感问题:您所看到的超链接(如心猿社)的实现是我们自己手搓的插件,目前还有许多需要优化的地方(比如白名单,黑名单功能等),所以有的地方视觉体验还不那么好,见谅呀。

产品突破!

首个胃癌影像筛查AI模型,登《自然·医学》,临床验证敏感性超医生21.8%,阿里达摩院DAMO GRAPE【仔细查验】

阿里达摩院联合浙江省肿瘤医院推出全球首个胃癌影像筛查AI模型DAMO GRAPE,利用平扫CT识别早期胃癌,敏感性85.1%、特异性96.8%,较放射科医生分别提升21.8%和14.0%。近10万人临床研究中,两家地区医院胃癌检出率达24.5%和17.7%,且能提前2-10个月发现病灶,研究成果发表于《自然·医学》。【短评】不光是技术的进步,大家也要坚持让自己和家人检查,至少一年去体检一下,一年两次最好。【注意】某些网址加载慢,打不开是因为魔法问题。


研究突破。

绘画AI模型架构突破,μP理论扩展至扩散Transformer,人大&字节Seed联合开源【仔细查验】

人大高瓴团队与字节Seed首次将μP理论扩展至扩散Transformer,通过调整模块初始化与学习率,实现0.18B小模型超参直接迁移18B大模型,搜索计算量仅为人工调参的3%。实验显示,MMDiT-μP-18B训练Loss低于基线,文本对齐准确率达71.5%,代码已开源。 【短评】超参指的是训练前手动设定的参数。依据μP理论实现的迁移,实际就是一个“比例问题”。我们假设一个番茄,两个鸡蛋,再加上5g盐就是最好吃的番茄炒蛋,由于食材的数量少,所以只需要一口小锅(小参数量模型);但要是大酒店也想“复刻”你番茄炒蛋的美味,那么就需要换口大锅(大参数模型),此时,“番茄:鸡蛋:盐”的“1:2:5”的比例不可改变,番茄炒蛋的味道才可以一样。【注意】某些网址加载慢,打不开是因为魔法问题。


思维必看!

OpenAI付费用户激增50%达300万,安进转用ChatGPT,微软与OpenAI在企业AI助手市场的竞争

微软作为OpenAI投资方,却在企业AI助手市场面临激烈竞争。制药巨头安进原采购微软Copilot,后因Chatgpt在科研文献摘要等任务中表现更优,扩大ChatGPT应用。OpenAI企业付费用户数激增50%至300万,微软称财富500强中70%企业试用Copilot,付费用户数同比翻3倍。微软强调企业场景适配,OpenAI突出技术更新优势。学术深思】主要还是科研性能优势,不过在“边际效应”下,双方的差距只会越来越小,等到双方来到同一梯队,那微软的优势会比OpenAI高出许多。【注意】某些网址加载慢,打不开是因为魔法问题。


国内动向*

AI设备发布,集成Shadow AI,支持120+语言转写且准确率98%,出门问问TicNote【仔细查验】

出门问问发布全球首款Agentic AI硬件TicNote,搭载自研Shadow AI,支持120多种语言录音转写,准确率达98%,可生成摘要、思维导图及待办事项,还能跨文件搜索和生成播客。设备厚3mm、重约217g,续航超20小时,售价999元起。未来将推出TicNote Watch等系列产品,构建自我进化AI系统。 【短评】是磁吸到手机背部的,手机是否支持磁吸需要注意;最低价999元;值不值各位点击详情查看吧。【注意】某些网址加载慢,打不开是因为魔法问题。


国外资讯:


多维发展,


有点意思~

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容