AI工具突破,动态结构化工具增强推理,OctoTools框架开源
中国DeepSeek公司于2月24日发布并开源OctoTools框架,这是一个模块化、无需训练且可扩展的框架,旨在通过动态、结构化的外部工具使用来增强AI的推理能力,推进AI模型与外部工具交互方式的标准化。
国防AI突破,战场数据处理能力测试,GeDAI系统验证
韩国国防部在韩美“2025自由之盾”联合演习上测试生成式国防人工智能(GeDAI)处理战场数据的能力,以验证该系统用于战时任务的可行性。演习还将收集战场数据,训练GeDAI快速准确进行战场态势感知并做出指挥决策,以提高战时效率。
大模型加速器突破,专为英伟达Hopper GPU打造,FlashMLA发布
中国DeepSeek公司于2月24日正式发布并开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper GPU打造的大模型加速器,旨在提升模型在特定硬件上的运行效率和性能。
AI医疗普惠突破,支持50种皮肤疾病识别+百万医生连接,蚂蚁健康管家AQ上线
蚂蚁集团发布AI健康应用AQ,集成医疗大模型实现症状追问、报告拍照解读,连接全国5000家医院/百万医生,200位三甲名医AI分身7×24小时服务,单日单医生AI分身最高接诊11万人次,支持华为/苹果等可穿戴设备数据联动,已覆盖超7000万用户。
AI创作门槛突破,文本+素材一键生成动态视频,Vibemotion零代码平台开放
创新公司Vibemotion推出AI动态图形平台,用户输入文本提示+上传素材即可生成专业级动态视频,支持16:9/9:16多比例输出,覆盖广告/教育/社交媒体场景,当前采用等候名单制开放,吸引超10万创作者预约。
AI教育模式突破,真互动1对1+国际教材,新东方AI1对1七月上线
新东方发布首款AI教育产品“AI1对1S体系原版营”,融合国家地理《LOOK看世界》、外研社《TH!NK》教材,AI老师模拟真实教学场景,支持高频互动问答与学习反馈,7月2日通过“新东方一点一看”APP开放,目标实现英语能力从输入到输出的转化。
AI志愿填报突破,三线城市占比48%,夸克深度搜索日均服务千万考生
夸克高考数据显示,高考出分三天内生成500万份AI志愿报告,三线及以下城市需求占比48%,单考生平均使用4次深度搜索。其“志愿报告”智能Agent可识别分数/选科/职业倾向,生成含录取概率、专业分析的专家级建议,单日最高处理250万份请求。
文生图技术突破,2K分辨率文本渲染无错,谷歌Imagen4
谷歌发布Imagen4文生图模型,文本渲染准确率提升70%,支持2K分辨率与10倍速快速模式,新增SynthID水印防滥用。Imagen4 Ultra版精准对齐广告级需求,API调用单价0.04-0.06美元,已开放企业试用。
AI安全突破,全自动检测1060个漏洞,XBOW登顶HackerOne
XBOW AI工具在HackerOne平台提交1060个漏洞(132个高危),首次超越人类研究员登顶美国榜,检测范围覆盖RCE、SQL注入等6类漏洞,误报率低于行业均值45%。获7500万美元B轮融资,计划8月公开核心技术。
生命科学突破,秒级解析百万碱基变异,谷歌AlphaGenome
DeepMind推出AlphaGenome,支持单次分析100万个DNA碱基,1秒内评估基因突变对8类分子特性的影响,覆盖细胞类型、基因剪接等多维度预测。基于Transformer+TPU架构,已接入API供全球科研团队加速新药研发。
iOS应用下载突破,2960万超越四大社交总和,ChatGPT
ChatGPT iOS应用过去28天下载2960万次,首次超越TikTok等四大社交应用总和(3290万),差距10.6%,月活用户达6亿(Gemini 3.5亿),但66%美国成年人仍未使用。
开发者工具突破,100万token+代码助手整合,谷歌Gemini CLI
谷歌发布Gemini CLI命令行工具,支持100万token上下文窗口,深度整合代码助手,提供每分钟60次/每日1000次免费配额,覆盖编程、内容生成等多场景。
隐私功能突破,AI摘要+安全云环境,WhatsApp
WhatsApp推AI消息摘要功能,用Meta AI生成未读内容总结,默认关闭且支持隐私隔离,用户可阻止群聊AI,但准确性存疑,此前因广告和强制按钮引发争议。
数据安全突破,谷歌文档泄露客户机密,Scale AI
Scale AI被曝用公开谷歌文档存储Meta、谷歌等客户绝密信息(含700个xAI训练提示),暴露85份敏感文件,含员工薪资细节,客户已启动业务切割。
文生图精度突破,2K文本渲染+SynthID水印,谷歌Imagen4
谷歌发布Imagen4文生图模型,文本渲染准确率提升70%,支持2K分辨率及10倍速“快速模式”,新增Imagen4Ultra高精度版(0.06美元/张),强制嵌入SynthID水印防伪造,已开放Gemini API付费预览。
漏洞检测突破,千余漏洞登顶HackerOne,XBOW AI
XBOW自主AI工具首次超越人类,登顶HackerOne美国漏洞榜(提交1060个,132个确认),覆盖RCE/XSS等12类漏洞,检测效率超人工20倍,获7500万美元B轮融资,主打“黑盒自动化渗透测试”,客户包括迪士尼、福特。
基因预测突破,百万碱基秒级分析,谷歌AlphaGenome
DeepMind推出AlphaGenome,支持单次分析100万个DNA碱基,毫秒级预测基因突变对8类分子特性的影响(如RNA生成、剪接位点),通过TPU集群实现长序列+高分辨率平衡,已开放API助力新疗法研发。
全球首部AIGC单元剧首映,创作需“反复抽卡”调优,可灵AI《新世界加载中》
快手可灵AI联合星芒短剧推出7部单元剧《新世界加载中》,融合科幻/历史/奇幻题材,通过首尾帧技术实现流畅打斗,但存在角色一致性不足、人脸失真问题。可灵AI负责人李杨称当前需反复调试提示词,专业创作者主导用户池,商业化ARR超1亿美元,团队聚焦运动表现与语义遵从优化。
Gemini CLI开源免费,100万token挑战编程工具,谷歌掀AI开发革命
谷歌发布开源终端工具Gemini CLI,提供免费Gemini2.5Pro模型(100万token上下文),集成搜索/多模态创作,支持“橘猫冒险短视频”生成,日免费1000次请求颠覆Cursor等付费工具。依托自研芯片成本优势,欲重定义AI编程标准,GitHub获9000+星标。
Getty撤诉Stability AI核心指控,17亿索赔转向商标纠纷,版权战缩围
图片巨头Getty撤回对Stability AI的训练/输出侵权指控(英国),保留次级侵权及商标诉讼,美国索赔仍达17亿美元。法律专家指证据不足导致撤诉,Stable Diffusion水印争议转向消费者认知判定。Getty同步推自研AIGC工具,利用自有图库训练可授权模型。
Ring智能设备推AI事件描述,运动识别升级引隐私争议
亚马逊旗下Ring为门铃/摄像头加入AI运动事件描述功能(如“带黑狗的人上台阶”),首批向美加付费用户测试,支持禁用。尽管提升安防精度,但“学习用户习惯”的未来功能引发隐私担忧,此前Ring曾因数据问题受争议。
版权诉讼升级,20万盗版书训练模型,微软遭作家索赔
微软因使用近20万本盗版书籍训练Megatron模型,被凯·伯德等作家起诉,索赔单部作品最高15万美元,争议聚焦AI训练的“合理使用”边界,涉及Meta、Anthropic等公司。
机器人营收破十亿,9年从一人到巨头,宇树科技亮相达沃斯
宇树科技创始人王兴兴在天津达沃斯透露,公司从2016年“一人公司”成长为年营收10亿元、近千员工的机器人企业,展现国产机器人硬件规模化突破,未披露具体产品线细节。
AI训练版权突破,美法院首认合法使用已购书籍,Anthropic胜诉
美国法院裁定Anthropic可未经授权使用合法购买书籍训练AI,认定AI训练属“转化性使用”,不替代原作市场。但盗版书籍使用仍涉侵权,需另案处理。此案为美国首起认可AI训练合理使用的判决,降低行业数据合规风险。
向量数据库突破,OB Cloud支持十亿级多模态数据,银泰/携程等企业落地
OceanBase宣布OB Cloud支持十亿级文本/图像向量检索,一体化架构融合事务/分析/AI负载,在银泰“智能问数”、携程“以图搜图”等场景实现秒级响应。伯俊科技基于OB Cloud构建AI通识助手,库存调度效率提升60%,降低企业RAG部署成本80%。
学术产业突破,MIT终身教授何恺明加盟DeepMind,任杰出科学家
MIT新晋终身教授何恺明(ResNet作者)兼任谷歌DeepMind杰出科学家,此前已合作发表分形生成模型等成果。其MIT团队近期提出“无需训练的压缩Tokenizer生成文本”等创新,累计引用超71万次。此次兼职或推动CV与大模型技术融合,探索生成模型新范式。
通用生物医学AI突破,跨25领域自主生成研究流程,斯坦福Biomni
斯坦福联合基因泰克等开发Biomni,整合150+专业工具/105软件/59数据库,通过LLM推理+代码执行实现零样本泛化,成功设计基因克隆实验方案(湿实验验证100%正确),分析458份可穿戴数据发现餐后体温变化规律。
计算机视觉顶会突破,ICCV 2025投稿1.1万+录用24%,引入审稿人问责制
ICCV 2025录取2699篇(录用率24%),投稿量较2019年增长160%,首次因25名”不负责任审稿人”直接拒稿29篇(含12篇本可录用论文),引发学界对评审公平性争议。
郑州AI产业政策突破,2000亿规模+DeepSeek政务接入,三年行动方案出炉
郑州市政府发布《2025-2027场景驱动AI创新方案》,计划2025年AI核心产业超350亿、相关产业破2000亿,开放政务系统接入DeepSeek大模型,打造医疗/工业等20个深度场景,扩容国家超算中心构建算力网。
医疗AI融资突破,Abridge获3亿美元估值53亿,年内支持5000万次医患对话
美国医疗AI公司Abridge完成3亿美元融资(估值53亿美元),其环境监听技术已部署150家卫生系统,通过实时医患对话生成临床记录,本轮资金将拓展AI辅助医疗编码业务,降低保险拒付风险,计划年内覆盖超5000万次对话。
基因AI模型突破,AlphaGenome百万碱基预测,24项基准超现有技术
谷歌DeepMind推出AlphaGenome,以百万碱基DNA序列为输入,单碱基分辨率预测20+基因调控特性,在24/26项变异效应基准中超越最优模型,支持秒级变异评分,覆盖基因表达、剪接等多模态,助力癌症机制研究及合成生物学。
生物电子技术突破,哈佛胚胎植入网,《Nature》封面实现脑发育全周期记录
哈佛大学开发亚微米级柔软电子网,植入非洲爪蟾胚胎神经板,随神经管三维发育自然整合,在蝌蚪脑内实现单神经元电活动连续追踪,弹性模量匹配脑组织(0.1-1kPa),支持5天以上全脑动态记录,为神经发育研究提供无创工具。
前言.
今日更新:
- 【AI+英语协同】单词&短语背记方案,双端同步版——自动化更新:消除扇贝划选单词会出现的悬浮框,方便看句子。
目前已经上线滴工具&板块:
标签解析:
【伪人资讯】:虽然心猿社对资讯的真实性,时效性,广告问题已经做了初步的人工筛选,但仍然有社会影响大的,内容存在虚假的资讯存在,这样的资讯我们会标注上“伪人资讯”,目的是进行澄清,防止大家被外面的资讯误导。
【仔细查验】:每一篇资讯心猿社都会继续人工查验,其中,我们认为要仔细核实,或者是要仔细阅读来帮助大家阅读的资讯,心猿社会进行“仔细查验”。
【追踪】:心猿社会对仍然有疑问的资讯进行追踪,追踪出现结果,心猿社会在后面的省流日报公布。
板块解析:
【产品突破】和【研究突破】:由于心猿社还处于信息库建立的初级阶段,所以部分不算突破的突破有时也会划进去,这是因为心猿社对该领域信息库建立的还不完善的缘故。
有关超链接观感问题:您所看到的超链接(如心猿社)的实现是我们自己手搓的插件,目前还有许多需要优化的地方(比如白名单,黑名单功能等),所以有的地方视觉体验还不那么好,见谅呀。
产品突破!
首个胃癌影像筛查AI模型,登《自然·医学》,临床验证敏感性超医生21.8%,阿里达摩院DAMO GRAPE【仔细查验】
阿里达摩院联合浙江省肿瘤医院推出全球首个胃癌影像筛查AI模型DAMO GRAPE,利用平扫CT识别早期胃癌,敏感性85.1%、特异性96.8%,较放射科医生分别提升21.8%和14.0%。近10万人临床研究中,两家地区医院胃癌检出率达24.5%和17.7%,且能提前2-10个月发现病灶,研究成果发表于《自然·医学》。
研究突破。
绘画AI模型架构突破,μP理论扩展至扩散Transformer,人大&字节Seed联合开源【仔细查验】
人大高瓴团队与字节Seed首次将μP理论扩展至扩散Transformer,通过调整模块初始化与学习率,实现0.18B小模型超参直接迁移18B大模型,搜索计算量仅为人工调参的3%。实验显示,MMDiT-μP-18B训练Loss低于基线,文本对齐准确率达71.5%,代码已开源。
思维必看!
OpenAI付费用户激增50%达300万,安进转用ChatGPT,微软与OpenAI在企业AI助手市场的竞争
微软作为OpenAI投资方,却在企业AI助手市场面临激烈竞争。制药巨头安进原采购微软Copilot,后因Chatgpt在科研文献摘要等任务中表现更优,扩大ChatGPT应用。OpenAI企业付费用户数激增50%至300万,微软称财富500强中70%企业试用Copilot,付费用户数同比翻3倍。微软强调企业场景适配,OpenAI突出技术更新优势。
暂无评论内容