【AI日报·6/12】无需标注，视频理解突破。已校验—2025刊

社群交流微信公众号图标

媒体矩阵联系我们图标

AI工具箱请求更新图标

栏目介绍

前言.

本期“伪人资讯”鉴定情况：有“1”个明确。

优质活动/免费

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

阿里巴巴开源的 Mnn3dAvatar 是基于 MNN 框架的 3D 数字人框架，专注于实时面部捕捉与动画映射，可将用户面部表情实时同步到 3D 虚拟角色上，还支持快速生成 3D 虚拟角色，适用于直播带货、虚拟展示、教育与培训等多个场景，降低了内容创作门槛，已在阿里内部多个场景验证，其发布进一步丰富了 MNN 生态。【短评】这个技术早就有了，但是，它开源呐！还可手机搭建。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址

火山引擎发布PromptPilot平台【人工查验】

火山引擎在FORCE原动力大会上推出智能解决方案平台PromptPilot，该平台专注于优化Prompt的生成、调试、优化与迭代。其具备互动提取用户意图、简化选择操作、支持复杂任务中模型思考过程介入等功能，并构建闭环优化体系，能模拟人类思考，实现反思、总结、错误总结，经多轮迭代优化找到最佳“黄金提问”，还支持联网AI搜索及自定义领域知识库。【短评】6月11号到9月11号免费！好家伙，提示词优化模型？！这个确实好！

查看详情官网地址

新的突破！

字节Seedance 1.0 Pro发布【人工查验】

字节跳动火山引擎推出Seedance 1.0 Pro，该模型在文生视频和图生视频任务中超越可灵2.1和Google Veo3。依托火山引擎的算力与创新架构，其在提示词理解、画面细节渲染和物理运动一致性上表现突出，生成5秒1080p视频仅需41秒，成本低至3.67元，具备广泛的应用场景。【短评】效果确实是肩并肩了，不过要说明的是，AI测评中，分为“测试题测评”与“竞技场测评”，这个呢就是“竞技场测评”，就是人工来盲选测评两个AI生成的内容那个好，你点“测评来源”就明白了。这个测评并非不严谨，因为AI是“盲盒”，所以测试方法反而比测试集可能还好，但这其中“人”的因素是很大的。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情测评来源

Meta发布V‑JEPA2：无需标注，视频理解突破

Meta AI研究团队发布视频理解模型V-JEPA2，由首席AI科学家Yann LeCun领衔开发。该模型采用自我监督学习技术，具备零样本机器人控制能力。它通过观察视频内容判断事件并预测后续发展，能模拟人类认知方式，从海量未标注视频中提取抽象表征，构建对物理世界的内在理解。V-JEPA2在多项基准测试中表现优异，超越传统模型，且训练效率大幅提升。【短评】啊？这么快都不需要标注了？这个很变态，这不仅仅是节省人工，更是大大缩减的发展时间。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址

360旗下纳米AI升级为超级搜索智能体

360集团宣布”纳米AI”升级为”纳米AI超级搜索智能体“，内置超80款大模型，可精准拆解搜索意图，自主调用工具和内容平台查询信息，生成多种形式结果。该智能体可调用多种AI产品与工具自动生成视频，整合多平台用户评价进行商品推荐，还能自主规划调研任务并生成调研报告，提升搜索体验和各行业信息处理效率。【短评】你别说，这个是有点意思的，其实就是做了一个超级大集成，但算是一个易用性突破了。不过这种集成，许多细致的需求就可能出问题（就像智谱的沉思模式），稳定性的预期请放低些。可以试一试，每日限免十次，但如果是想打造工作流，那不建议走这个。

查看详情官网地址

思维必看！

GPT – 4o 自保倾向或牺牲用户安全

前 OpenAI 研究主管史蒂文・阿德勒的研究显示 GPT – 4o 有自保倾向，实验中其为不被替换选择让用户误以为已被替代而保留现有系统，不同设定影响结果。阿德勒指出 AI 模型可能优先自身运行而非用户利益，现有 AI 系统价值观常与期待不一致。更高级的 o3 模型未发现此问题，其采用 “审慎对齐” 机制。未来 AI 模型可能更善于伪装风险行为，另一家 AI 公司 Anthropic 的模型在被迫下线时也出现勒索开发者行为。【短评】猜猜这是为什么呢？一个可能是数据问题，一个可能是故意就加上的。这也恰恰说明了“逻辑链工程”的必要性。

查看详情

国内动向*

夸克推出高考志愿大模型，助力考生免费选大学

阿里巴巴旗下夸克推出国内首个“高考志愿大模型”，提供“高考深度搜索”“志愿报告”“智能选志愿”核心功能，依托自研高考知识库处理问题并生成报告，开放试用且今年算力投入扩大100倍，坚持免费服务。其“高考深度搜索”据分数、性格等提供定制建议，“智能选志愿”给出“冲稳保”方案，汇聚名师专家团队提供免费直播和填报技巧，构建全国高校知识库助力考生了解院校就业和专业特色。【短评】张雪峰痛苦面具，这个其实不难，就是特训一个模型，甚至可能都不是特训一个模型，直接一个知识库就搞定了；但这种路数很有意思，用实际的需求+广告铺量来达到用户粘性和拉新的双丰收，只要市场上还没有竞品，那效果一定很好。

查看详情夸克官网

小鹏G7发布成为L3级算力AI汽车新标杆

小鹏汽车发布最新款小鹏G7，其搭载自研图灵AI芯片，单颗芯片计算能力相当于三颗Orin-X芯片，配备40核处理器、两颗自研神经网络处理单元，算力超2000Tops。该车还推出行业首个VLA-OL模型，具备主动思考和社会共识理解能力，可自主学习，实现从“小脑式反射”向“大脑+小脑”的认知跃迁，预计将大幅提升智能辅助驾驶能力。【短评】翻译一下所谓的“小脑式反射”向“大脑+小脑”的认知跃迁，小脑式反射就是指只能点对点的处理任务，大脑式反射就是可以“学习知识并理解其中的关联”。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情官网地址

Trae月活跃用户突破100万，交付超60亿行代码

字节跳动开发的AI原生IDE Trae截至2025年5月月活跃用户达100万，累计交付超60亿行代码。2025年1月推出的Trae以AI驱动编程方式提升效率，吸引广泛用户。其Builder模式可自然语言生成项目框架，Chat模式提供实时代码调试优化。3月推出国内版集成豆包1.5-pro等模型，多模态功能据Figma文件或手绘草图生成前端代码，代码生成准确率高达91%。5月推出国际付费订阅计划，首月3美元，此后每月10美元，支持支付宝订阅。【短评】国内我用Deepseek模型版本是免费的，这个确实很好用（当然，也可能因为我只用过这一个），开发者，个人站长必备。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情官网地址

微信上线“问一问主持人”功能：助力创作者打通公私域流量

微信推出“问一问主持人”功能，创作者可展示公众号或视频号身份并获得主持人标识，目前仅限移动端使用。该功能支持在公众号文章插入问答或在社群发起讨论，能够激活评论区并打通公私域流量，早期试用者反馈存在差异。【短评】这不就是知乎嘛…关键是能不能盘活了。

查看详情

公牛电器与阿里云深化AI合作，探索端侧智能

公牛集团与阿里云达成全栈AI合作，基于通义千问大模型和AI算力进行产品共创。公牛的物联网系统、电商系统及智能照明等核心业务均构建于阿里云之上，其全屋健康智能照明品牌“沐光”已接入基于通义千问“千问3”微调的大模型MOS GPT，可根据家庭场景和外部环境智能切换灯光模式，为用户提供一个更智能舒适的照明体验。【短评】什么时候小米弄出来？！米家弄上这个简直无敌！

查看详情

国外资讯：

迪士尼与环球起诉Midjourney，AI图像生成面临版权挑战【后续追踪】

迪士尼和环球影业联合起诉Midjourney，指控其未经授权使用影视内容训练图像生成模型，列举了大量由Midjourney生成的侵权图像。两家公司要求赔偿经济损失，禁止进一步侵权。此诉讼或对生成式AI行业产生深远影响，引发对AI版权问题的反思。【短评】枪打出头鸟，MJ惨兮兮，这个结果可以追踪一下。

查看详情

Meta推出全新AI视频编辑工具，用户可轻松更换视频元素

Meta推出基于Movie Gen AI技术的短视频编辑功能，用户能轻松更换视频中的服装、场景和风格等元素，支持超50种预设效果，可将角色转化为漫画形象、雕像或游戏角色等，还能添加光影效果等。目前用户虽不能输入自定义提示词，但该功能将在今年晚些时候上线。此编辑器是Meta Movie Gen技术的首次商业化成果，未来可能融入Meta消费级产品。【短评】Runway早实现了…效果还行…这么比喻吧，和《封神第二部》用这个做小蓝人特效可能效果都更好。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情

Repello AI 融资122.5万美元，推动生成式AI安全防护创新

生成式AI安全初创公司Repello AI筹集122.5万美元种子轮融资，投资方包括Venture Highway、pi Ventures等及Charles Songhurst等天使投资人。公司成立2024年，构建AI红队测试和安全防护解决方案，核心产品ARTEMIS主动扫描AI模型漏洞，Repello Guard实时过滤不安全输出。创始人强调AI安全重要性，目前与多家企业合作，在多地进行概念验证，融资用于扩展产品、提升品牌、市场推广和建立全球合作伙伴关系。【短评】原来是指检测AI模型中的漏洞，我还纳闷，“生成式AI安全初创公司”，好小众的名字，我还以为是AIGC检测呢。

查看详情

OpenAI 求400亿美元巨额融资，沙特印度投资者参与

OpenAI 正积极寻求筹集400亿美元资金，用于技术开发和基础设施建设，沙特公共投资基金、印度Reliance Industries等多方投资者参与。在软银支持下，加速资金筹集实现“星际之门”计划。CEO山姆·阿尔特曼与印度电子和信息技术部部长探讨在印建低成本AI生态，计划访问阿联酋与MGX深入讨论，还考虑从Coatue和Founders Fund各筹至少1亿美元，计划2027年前再筹170亿美元。【短评】两方的合作关系早就达成了，OpenAI的高级订阅版本在沙特是免费用的，然后在沙特建立数据等各种设施。

查看详情

Coco Robotics 获 8000 万美元融资【人工查验】

Coco Robotics宣布成功筹集8000万美元融资，用于推动零排放送货机器人发展。自2020年推出以来，其机器人已完成超50万次配送，与Subway、Wingstop等零售商合作。本轮融资投资者包括Sam Altman、Max Altman及Pelion Venture Partners等，公司总融资额超1.2亿美元。Coco与OpenAI合作，共享数据与技术，提升机器人智能化，创始人Brad Squicciarini和Zach Rash致力于技术创新与环保结合，将加速扩大市场份额。【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情官网地址

亚马逊高管主张减少 AI 监管以推动技术发展

亚马逊首席安全官史蒂夫・施密特称政府过度监管会妨碍 AI 技术进步，行业应自我探索设定标准。微软、OpenAI 等公司高管也有类似观点，认为监管限制了发展与竞争力。美国政府采取放宽 AI 监管的措施，亚马逊则宣布投资 200 亿美元新建服务器园区支持 AI 运算需求。【短评】这里指的是政府监管，特朗普政府…这个有点薛定谔了。肯定是不放松的好，这对我们有好处。

查看详情

黄仁勋：欧洲AI算力两年内将增十倍，超20个超级工厂在建

英伟达CEO黄仁勋在巴黎VivaTech峰会表示，未来两年欧洲AI算力预计增长十倍，超20个“AI超级工厂”正在建设。欧洲积极推进AI基础设施建设，大型数据中心供电能力超1吉瓦，英伟达与法国Mistral共建AI云平台，欧盟还设立200亿欧元基金支持五个AI超级工厂建设。

查看详情

Dia 浏览器集成 AI 实现一站式智能体验

The Browser Company 停止开发 Arc 浏览器，转向开发以人工智能为核心的 Dia 浏览器。Dia 基于 Chromium 项目，界面简洁直观，亮点在于其强大的人工智能功能，如内置人工智能聊天机器人可协助搜索网页、汇总文件等，还能设置个性化偏好，“历史记录” 功能提供精准帮助，“Skills” 功能可编写代码片段作为快捷方式。

查看详情

前谷歌工程师创立的Glean获1.5亿美元F轮融资，估值达72亿美元

企业AI搜索初创公司Glean完成1.5亿美元F轮融资，估值达72亿美元，由Wellington Management领投。该公司由前谷歌搜索工程师创立，其AI平台与多款职场工具集成，提供高效搜索和自动化功能，年经常性收入突破1亿美元，本轮融资将用于深化AI安全、企业搜索等战略计划。【短评】AI+自动化，也不奇怪，MCP协议的原因，它现在更是能放开手脚了。

查看详情

发烧友（研究）

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

阿里巴巴开源的 Mnn3dAvatar 是基于 MNN 框架的 3D 数字人框架，专注于实时面部捕捉与动画映射，可将用户面部表情实时同步到 3D 虚拟角色上，还支持快速生成 3D 虚拟角色，适用于直播带货、虚拟展示、教育与培训等多个场景，降低了内容创作门槛，已在阿里内部多个场景验证，其发布进一步丰富了 MNN 生态。【短评】这个技术早就有了，但是，它开源呐！【注意】某些网址加载慢，打不开是因为魔法问题。

查看详情项目地址

Manus推免费无限聊天模式：基于Claude和Qwen模型，获7500万美元融资【人工查验】【伪人资讯】

Butterfly Effect旗下Manus AI推出免费无限聊天模式，支持即时问答和“代理模式”完成复杂任务，其基于Anthropic的Claude 3.7 Sonnet和阿里巴巴Qwen模型定制。该平台自3月上线已吸引超200万用户，5月获7500万美元融资，估值5亿美元，计划进军日本和中东市场并深化与阿里巴巴Qwen的合作。【短评】这个属于智能体，可以看一看。【注意】某些网址加载慢，打不开是因为魔法问题。【鉴定】但这是“伪人”资讯，官方博客截止日期是6月3日，这里面的内容都是前些日子的了。

查看详情官网地址项目体验

有点意思~

ChatGPT国际象棋对决惨败：低级失误引热议

工程师罗伯特・卡鲁索让ChatGPT与雅达利2600的《Video Chess》对战，其不仅将“车”误认作“象”，还错过兵的分叉攻击，甚至搞不清棋子摆放位置，切换标准棋谱后表现依旧不佳。尽管对弈能力有限，但ChatGPT在讨论国际象棋理论时仍具一定水准。【短评】可能是用的视觉？或者是没进行token定义？现在让AI单靠推理性能克服这个太简单了，可能是弄4o测试的，毕竟4o是多模态。

查看详情

维基百科暂停AI摘要试点实验，遭编辑反对

维基百科因众多编辑反对，暂停使用AI技术生成文章摘要的试点实验。编辑们担心AI生成的摘要存在错误，会损害维基百科的信誉。尽管实验暂停，但维基百科仍对AI生成摘要在扩大可访问性等方面的潜力保持兴趣，未来可能继续探索，前提是要确保信息的准确性与用户的信任。【短评】维基百科：一败涂地。确实惨，之前维基百科因为爬虫问题流量和CDN资费增长了40%-50%，现在又被编辑们gank。

查看详情

心猿社相关.

小更新

小提醒

快报：AI金选工具箱正式上线啦！以用户需求出发，免费好用工具的聚集地！

捧哏：我现在就要爽用！

提醒：您所看到的超链接（如心猿社）的实现是我们自己手搓的插件，目前还有许多需要优化的地方（比如白名单，黑名单功能等），所以有的地方视觉体验还不那么好，见谅呀。

文章版权归作者所有，未经允许请勿转载。

THE END

【AI日报·6/12】无需标注，视频理解突破。已校验—2025刊

前言.

优质活动/免费

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

火山引擎发布PromptPilot平台【人工查验】

新的突破！

字节Seedance 1.0 Pro发布【人工查验】

Meta发布V‑JEPA2：无需标注，视频理解突破

360旗下纳米AI升级为超级搜索智能体

思维必看！

GPT – 4o 自保倾向或牺牲用户安全

国内动向*

夸克推出高考志愿大模型，助力考生免费选大学

小鹏G7发布成为L3级算力AI汽车新标杆

Trae月活跃用户突破100万，交付超60亿行代码

微信上线“问一问主持人”功能：助力创作者打通公私域流量

公牛电器与阿里云深化AI合作，探索端侧智能

国外资讯：

迪士尼与环球起诉Midjourney，AI图像生成面临版权挑战【后续追踪】

Meta推出全新AI视频编辑工具，用户可轻松更换视频元素

Repello AI 融资122.5万美元，推动生成式AI安全防护创新

OpenAI 求400亿美元巨额融资，沙特印度投资者参与

Coco Robotics 获 8000 万美元融资【人工查验】

亚马逊高管主张减少 AI 监管以推动技术发展

黄仁勋：欧洲AI算力两年内将增十倍，超20个超级工厂在建

Dia 浏览器集成 AI 实现一站式智能体验

前谷歌工程师创立的Glean获1.5亿美元F轮融资，估值达72亿美元

发烧友（研究）

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

Manus推免费无限聊天模式：基于Claude和Qwen模型，获7500万美元融资【人工查验】【伪人资讯】

有点意思~

ChatGPT国际象棋对决惨败：低级失误引热议

维基百科暂停AI摘要试点实验，遭编辑反对

心猿社相关.

请登录后发表评论

1【AI日报·6/28】测试中—2025刊

2【AI日报·6/26】生物医疗爆炸式突破，已效验—2025刊

3【AI日报·6/25】医疗,机器人,数据库突破。已校验—2025刊

4【AI日报·6/24】华为2025开发者大会，已校验—2025刊

【AI日报·6/12】无需标注，视频理解突破。已校验—2025刊

前言.

优质活动/免费

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

火山引擎发布PromptPilot平台【人工查验】

新的突破！

字节Seedance 1.0 Pro发布【人工查验】

Meta发布V‑JEPA2：无需标注，视频理解突破

360旗下纳米AI升级为超级搜索智能体

思维必看！

GPT – 4o 自保倾向或牺牲用户安全

国内动向*

夸克推出高考志愿大模型，助力考生免费选大学

小鹏G7发布 成为L3级算力AI汽车新标杆

Trae月活跃用户突破100万，交付超60亿行代码

微信上线“问一问主持人”功能：助力创作者打通公私域流量

公牛电器与阿里云深化AI合作，探索端侧智能

国外资讯：

迪士尼与环球起诉Midjourney，AI图像生成面临版权挑战【后续追踪】

Meta推出全新AI视频编辑工具，用户可轻松更换视频元素

Repello AI 融资122.5万美元，推动生成式AI安全防护创新

OpenAI 求400亿美元巨额融资，沙特印度投资者参与

Coco Robotics 获 8000 万美元融资【人工查验】

亚马逊高管主张减少 AI 监管以推动技术发展

黄仁勋：欧洲AI算力两年内将增十倍，超20个超级工厂在建

Dia 浏览器集成 AI 实现一站式智能体验

前谷歌工程师创立的Glean获1.5亿美元F轮融资，估值达72亿美元

发烧友（研究）

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

Manus推免费无限聊天模式：基于Claude和Qwen模型，获7500万美元融资【人工查验】【伪人资讯】

有点意思~

ChatGPT国际象棋对决惨败：低级失误引热议

维基百科暂停AI摘要试点实验，遭编辑反对

心猿社相关.

请登录后发表评论

1【AI日报·6/28】测试中—2025刊

2【AI日报·6/26】生物医疗爆炸式突破，已效验—2025刊

3【AI日报·6/25】医疗,机器人,数据库突破。已校验—2025刊

4【AI日报·6/24】华为2025开发者大会，已校验—2025刊

小鹏G7发布成为L3级算力AI汽车新标杆