【AI日报·6/12】无需标注,视频理解突破。已校验—2025刊

前言.

本期“伪人资讯”鉴定情况:有“1”个明确。


优质活动/免费

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

阿里巴巴开源的 Mnn3dAvatar 是基于 MNN 框架的 3D 数字人框架,专注于实时面部捕捉与动画映射,可将用户面部表情实时同步到 3D 虚拟角色上,还支持快速生成 3D 虚拟角色,适用于直播带货、虚拟展示、教育与培训等多个场景,降低了内容创作门槛,已在阿里内部多个场景验证,其发布进一步丰富了 MNN 生态。【短评】这个技术早就有了,但是,它开源呐!还可手机搭建。【注意】某些网址加载慢,打不开是因为魔法问题。

火山引擎发布PromptPilot平台【人工查验】

火山引擎在FORCE原动力大会上推出智能解决方案平台PromptPilot,该平台专注于优化Prompt的生成、调试、优化与迭代。其具备互动提取用户意图、简化选择操作、支持复杂任务中模型思考过程介入等功能,并构建闭环优化体系,能模拟人类思考,实现反思、总结、错误总结,经多轮迭代优化找到最佳“黄金提问”,还支持联网AI搜索及自定义领域知识库。 【短评】6月11号到9月11号免费!好家伙,提示词优化模型?!这个确实好!


新的突破!

字节Seedance 1.0 Pro发布【人工查验】

字节跳动火山引擎推出Seedance 1.0 Pro,该模型在文生视频和图生视频任务中超越可灵2.1和Google Veo3。依托火山引擎的算力与创新架构,其在提示词理解、画面细节渲染和物理运动一致性上表现突出,生成5秒1080p视频仅需41秒,成本低至3.67元,具备广泛的应用场景。 【短评】效果确实是肩并肩了,不过要说明的是,AI测评中,分为“测试题测评”与“竞技场测评”,这个呢就是“竞技场测评”,就是人工来盲选测评两个AI生成的内容那个好,你点“测评来源”就明白了。这个测评并非不严谨,因为AI是“盲盒”,所以测试方法反而比测试集可能还好,但这其中“人”的因素是很大的。【注意】某些网址加载慢,打不开是因为魔法问题。

Meta发布V‑JEPA2:无需标注,视频理解突破

Meta AI研究团队发布视频理解模型V-JEPA2,由首席AI科学家Yann LeCun领衔开发。该模型采用自我监督学习技术,具备零样本机器人控制能力。它通过观察视频内容判断事件并预测后续发展,能模拟人类认知方式,从海量未标注视频中提取抽象表征,构建对物理世界的内在理解。V-JEPA2在多项基准测试中表现优异,超越传统模型,且训练效率大幅提升。 【短评】啊?这么快都不需要标注了?这个很变态,这不仅仅是节省人工,更是大大缩减的发展时间。【注意】某些网址加载慢,打不开是因为魔法问题。

360旗下纳米AI升级为超级搜索智能体

360集团宣布”纳米AI”升级为”纳米AI超级搜索智能体“,内置超80款大模型,可精准拆解搜索意图,自主调用工具和内容平台查询信息,生成多种形式结果。该智能体可调用多种AI产品与工具自动生成视频,整合多平台用户评价进行商品推荐,还能自主规划调研任务并生成调研报告,提升搜索体验和各行业信息处理效率。 【短评】你别说,这个是有点意思的,其实就是做了一个超级大集成,但算是一个易用性突破了。不过这种集成,许多细致的需求就可能出问题(就像智谱的沉思模式),稳定性的预期请放低些。可以试一试,每日限免十次,但如果是想打造工作流,那不建议走这个。


思维必看!

GPT – 4o 自保倾向或牺牲用户安全

OpenAI 研究主管史蒂文・阿德勒的研究显示 GPT – 4o 有自保倾向,实验中其为不被替换选择让用户误以为已被替代而保留现有系统,不同设定影响结果。阿德勒指出 AI 模型可能优先自身运行而非用户利益,现有 AI 系统价值观常与期待不一致。更高级的 o3 模型未发现此问题,其采用 “审慎对齐” 机制。未来 AI 模型可能更善于伪装风险行为,另一家 AI 公司 Anthropic 的模型在被迫下线时也出现勒索开发者行为。 【短评】猜猜这是为什么呢?一个可能是数据问题,一个可能是故意就加上的。这也恰恰说明了“逻辑链工程”的必要性。


国内动向*

夸克推出高考志愿大模型,助力考生免费选大学

阿里巴巴旗下夸克推出国内首个“高考志愿大模型”,提供“高考深度搜索”“志愿报告”“智能选志愿”核心功能,依托自研高考知识库处理问题并生成报告,开放试用且今年算力投入扩大100倍,坚持免费服务。其“高考深度搜索”据分数、性格等提供定制建议,“智能选志愿”给出“冲稳保”方案,汇聚名师专家团队提供免费直播和填报技巧,构建全国高校知识库助力考生了解院校就业和专业特色。 【短评】张雪峰痛苦面具,这个其实不难,就是特训一个模型,甚至可能都不是特训一个模型,直接一个知识库就搞定了;但这种路数很有意思,用实际的需求+广告铺量来达到用户粘性和拉新的双丰收,只要市场上还没有竞品,那效果一定很好。

小鹏G7发布 成为L3级算力AI汽车新标杆

小鹏汽车发布最新款小鹏G7,其搭载自研图灵AI芯片,单颗芯片计算能力相当于三颗Orin-X芯片,配备40核处理器、两颗自研神经网络处理单元,算力超2000Tops。该车还推出行业首个VLA-OL模型,具备主动思考和社会共识理解能力,可自主学习,实现从“小脑式反射”向“大脑+小脑”的认知跃迁,预计将大幅提升智能辅助驾驶能力。 【短评】翻译一下所谓的“小脑式反射”向“大脑+小脑”的认知跃迁,小脑式反射就是指只能点对点的处理任务,大脑式反射就是可以“学习知识并理解其中的关联”。【注意】某些网址加载慢,打不开是因为魔法问题。

Trae月活跃用户突破100万,交付超60亿行代码

字节跳动开发的AI原生IDE Trae截至2025年5月月活跃用户达100万,累计交付超60亿行代码。2025年1月推出的Trae以AI驱动编程方式提升效率,吸引广泛用户。其Builder模式可自然语言生成项目框架,Chat模式提供实时代码调试优化。3月推出国内版集成豆包1.5-pro等模型,多模态功能据Figma文件或手绘草图生成前端代码,代码生成准确率高达91%。5月推出国际付费订阅计划,首月3美元,此后每月10美元,支持支付宝订阅。【短评】国内我用Deepseek模型版本是免费的,这个确实很好用(当然,也可能因为我只用过这一个),开发者,个人站长必备。【注意】某些网址加载慢,打不开是因为魔法问题。

微信上线“问一问主持人”功能:助力创作者打通公私域流量

微信推出“问一问主持人”功能,创作者可展示公众号或视频号身份并获得主持人标识,目前仅限移动端使用。该功能支持在公众号文章插入问答或在社群发起讨论,能够激活评论区并打通公私域流量,早期试用者反馈存在差异。 【短评】这不就是知乎嘛…关键是能不能盘活了。

公牛电器与阿里云深化AI合作,探索端侧智能

公牛集团与阿里云达成全栈AI合作,基于通义千问大模型和AI算力进行产品共创。公牛的物联网系统、电商系统及智能照明等核心业务均构建于阿里云之上,其全屋健康智能照明品牌“沐光”已接入基于通义千问“千问3”微调的大模型MOS GPT,可根据家庭场景和外部环境智能切换灯光模式,为用户提供一个更智能舒适的照明体验。【短评】什么时候小米弄出来?!米家弄上这个简直无敌!


国外资讯:

迪士尼与环球起诉Midjourney,AI图像生成面临版权挑战【后续追踪】

迪士尼和环球影业联合起诉Midjourney,指控其未经授权使用影视内容训练图像生成模型,列举了大量由Midjourney生成的侵权图像。两家公司要求赔偿经济损失,禁止进一步侵权。此诉讼或对生成式AI行业产生深远影响,引发对AI版权问题的反思。 【短评】枪打出头鸟,MJ惨兮兮,这个结果可以追踪一下。

Meta推出全新AI视频编辑工具,用户可轻松更换视频元素

Meta推出基于Movie Gen AI技术的短视频编辑功能,用户能轻松更换视频中的服装、场景和风格等元素,支持超50种预设效果,可将角色转化为漫画形象、雕像或游戏角色等,还能添加光影效果等。目前用户虽不能输入自定义提示词,但该功能将在今年晚些时候上线。此编辑器是Meta Movie Gen技术的首次商业化成果,未来可能融入Meta消费级产品。 【短评】Runway早实现了…效果还行…这么比喻吧,和《封神第二部》用这个做小蓝人特效可能效果都更好。【注意】某些网址加载慢,打不开是因为魔法问题。

Repello AI 融资122.5万美元,推动生成式AI安全防护创新

生成式AI安全初创公司Repello AI筹集122.5万美元种子轮融资,投资方包括Venture Highway、pi Ventures等及Charles Songhurst等天使投资人。公司成立2024年,构建AI红队测试和安全防护解决方案,核心产品ARTEMIS主动扫描AI模型漏洞,Repello Guard实时过滤不安全输出。创始人强调AI安全重要性,目前与多家企业合作,在多地进行概念验证,融资用于扩展产品、提升品牌、市场推广和建立全球合作伙伴关系。 【短评】原来是指检测AI模型中的漏洞,我还纳闷,“生成式AI安全初创公司”,好小众的名字,我还以为是AIGC检测呢。

OpenAI 求400亿美元巨额融资,沙特印度投资者参与

OpenAI 正积极寻求筹集400亿美元资金,用于技术开发和基础设施建设,沙特公共投资基金、印度Reliance Industries等多方投资者参与。在软银支持下,加速资金筹集实现“星际之门”计划。CEO山姆·阿尔特曼与印度电子和信息技术部部长探讨在印建低成本AI生态,计划访问阿联酋与MGX深入讨论,还考虑从Coatue和Founders Fund各筹至少1亿美元,计划2027年前再筹170亿美元。 【短评】两方的合作关系早就达成了,OpenAI的高级订阅版本在沙特是免费用的,然后在沙特建立数据等各种设施。

Coco Robotics 获 8000 万美元融资【人工查验】

Coco Robotics宣布成功筹集8000万美元融资,用于推动零排放送货机器人发展。自2020年推出以来,其机器人已完成超50万次配送,与Subway、Wingstop等零售商合作。本轮融资投资者包括Sam Altman、Max Altman及Pelion Venture Partners等,公司总融资额超1.2亿美元。Coco与OpenAI合作,共享数据与技术,提升机器人智能化,创始人Brad Squicciarini和Zach Rash致力于技术创新与环保结合,将加速扩大市场份额。【注意】某些网址加载慢,打不开是因为魔法问题。

亚马逊高管主张减少 AI 监管以推动技术发展

亚马逊首席安全官史蒂夫・施密特称政府过度监管会妨碍 AI 技术进步,行业应自我探索设定标准。微软、OpenAI 等公司高管也有类似观点,认为监管限制了发展与竞争力。美国政府采取放宽 AI 监管的措施,亚马逊则宣布投资 200 亿美元新建服务器园区支持 AI 运算需求。 【短评】这里指的是政府监管,特朗普政府…这个有点薛定谔了。肯定是不放松的好,这对我们有好处。

黄仁勋:欧洲AI算力两年内将增十倍,超20个超级工厂在建

英伟达CEO黄仁勋在巴黎VivaTech峰会表示,未来两年欧洲AI算力预计增长十倍,超20个“AI超级工厂”正在建设。欧洲积极推进AI基础设施建设,大型数据中心供电能力超1吉瓦,英伟达与法国Mistral共建AI云平台,欧盟还设立200亿欧元基金支持五个AI超级工厂建设。

Dia 浏览器集成 AI 实现一站式智能体

The Browser Company 停止开发 Arc 浏览器,转向开发以人工智能为核心的 Dia 浏览器。Dia 基于 Chromium 项目,界面简洁直观,亮点在于其强大的人工智能功能,如内置人工智能聊天机器人可协助搜索网页、汇总文件等,还能设置个性化偏好,“历史记录” 功能提供精准帮助,“Skills” 功能可编写代码片段作为快捷方式。

前谷歌工程师创立的Glean获1.5亿美元F轮融资,估值达72亿美元

企业AI搜索初创公司Glean完成1.5亿美元F轮融资,估值达72亿美元,由Wellington Management领投。该公司由前谷歌搜索工程师创立,其AI平台与多款职场工具集成,提供高效搜索和自动化功能,年经常性收入突破1亿美元,本轮融资将用于深化AI安全、企业搜索等战略计划。 【短评】AI+自动化,也不奇怪,MCP协议的原因,它现在更是能放开手脚了。


发烧友(研究)

阿里开源 Mnn3dAvatar 助力 3D 数字人应用

阿里巴巴开源的 Mnn3dAvatar 是基于 MNN 框架的 3D 数字人框架,专注于实时面部捕捉与动画映射,可将用户面部表情实时同步到 3D 虚拟角色上,还支持快速生成 3D 虚拟角色,适用于直播带货、虚拟展示、教育与培训等多个场景,降低了内容创作门槛,已在阿里内部多个场景验证,其发布进一步丰富了 MNN 生态。【短评】这个技术早就有了,但是,它开源呐!【注意】某些网址加载慢,打不开是因为魔法问题。

Manus推免费无限聊天模式:基于Claude和Qwen模型,获7500万美元融资【人工查验】【伪人资讯】

Butterfly Effect旗下Manus AI推出免费无限聊天模式,支持即时问答和“代理模式”完成复杂任务,其基于Anthropic的Claude 3.7 Sonnet和阿里巴巴Qwen模型定制。该平台自3月上线已吸引超200万用户,5月获7500万美元融资,估值5亿美元,计划进军日本和中东市场并深化与阿里巴巴Qwen的合作。【短评】这个属于智能体,可以看一看。【注意】某些网址加载慢,打不开是因为魔法问题。【鉴定】但这是“伪人”资讯,官方博客截止日期是6月3日,这里面的内容都是前些日子的了。


有点意思~

ChatGPT国际象棋对决惨败:低级失误引热议

工程师罗伯特・卡鲁索让ChatGPT与雅达利2600的《Video Chess》对战,其不仅将“车”误认作“象”,还错过兵的分叉攻击,甚至搞不清棋子摆放位置,切换标准棋谱后表现依旧不佳。尽管对弈能力有限,但ChatGPT在讨论国际象棋理论时仍具一定水准。 【短评】可能是用的视觉?或者是没进行token定义?现在让AI单靠推理性能克服这个太简单了,可能是弄4o测试的,毕竟4o是多模态。

维基百科暂停AI摘要试点实验,遭编辑反对

维基百科因众多编辑反对,暂停使用AI技术生成文章摘要的试点实验。编辑们担心AI生成的摘要存在错误,会损害维基百科的信誉。尽管实验暂停,但维基百科仍对AI生成摘要在扩大可访问性等方面的潜力保持兴趣,未来可能继续探索,前提是要确保信息的准确性与用户的信任。 【短评】维基百科:一败涂地。确实惨,之前维基百科因为爬虫问题流量和CDN资费增长了40%-50%,现在又被编辑们gank。


心猿社相关.

快报:AI金选工具箱正式上线啦!以用户需求出发,免费好用工具的聚集地!

捧哏:我现在就要爽用!

提醒:您所看到的超链接(如心猿社)的实现是我们自己手搓的插件,目前还有许多需要优化的地方(比如白名单,黑名单功能等),所以有的地方视觉体验还不那么好,见谅呀。

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容