前言.
本期“伪人资讯”鉴定情况:有“1”个明确,“1”个不确定。
新的突破!
豆包大模型1.6与Seedance1.0【人工查证】
字节跳动在FORCE原动力大会上推出了豆包大模型1.6和Seedance1.0pro视频生成模型,实现了AI云原生全栈服务升级。豆包大模型1.6采用按输入长度定价模式,在0-32K输入范围内输入费用为0.8元/百万tokens,综合成本较前版降低63%。其包含doubao-seed-1.6、doubao-seed-1.6-thinking、doubao-seed-1.6-flash三个模型,具备多模态理解、GUI操作能力及“边想边搜”“DeepResearch”功能。Seedance1.0pro视频生成模型支持无缝多镜头叙事等,处于行业领先地位。
思维必看!
美国政府推进AI.gov项目,提升联邦政府工作效率
美国总务管理局开发AI.gov网站,旨在整合政府各部门AI操作。该项目包括聊天机器人、全能API和实时监控工具CONSOLE,允许连接OpenAI等公司模型,同时与FedRAMP认证供应商合作,虽引发数据安全担忧,但凸显政府对AI应用的重视。
科学家证实大语言模型“理解”方式与人类相似【人工查证】
中国科学院自动化研究所证实,多模态大语言模型在训练过程中能够自发“理解”事物,与人类认知方式相似。研究借鉴人类大脑认知原理,设计实验让大模型与人类玩“找不同”游戏,绘制出大模型的“概念地图”。多模态模型在“思考”和选择方面与人类方式更为接近。
国内动向*
字节跳动TRAE产品升级月活破百万,多款AI产品更新迭代
字节跳动AI IDE产品TRAE升级,月活用户超100万,新增代码补全、生成、重构等功能,向支持AI开发全流程迈进。同时,Trae平台集成Gemini2.5Pro Preview,提升Web应用开发能力。
中国团队Qwen与DeepSeek入围Hugging Face开源模型贡献榜TOP15
Hugging Face发布开放权重模型贡献榜,中国团队Qwen和DeepSeek入围前15名。Qwen3系列模型在指令跟随和代码生成任务表现优异,轻量化模型QwQ-32B降低部署成本。DeepSeek的R1系列模型以低成本高性能著称,在LiveCodeBench排行榜超越多个国际竞品。Qwen计划探索多模态技术,DeepSeek将推R2模型,持续推动AI创新。
腾讯音乐收购喜马拉雅,打造音频与AI融合生态
腾讯音乐娱乐集团宣布以现金及股权方式全资收购长音频平台喜马拉雅,总价值达12.6亿美元。交易完成后,喜马拉雅将在过渡期内保持独立运营,但双方将深度结合资源,共同打造综合性音频内容生态,推动AI与音频产业融合。
国外资讯:
法国Mistral实验室发布推理模型【人工查证】
Mistral推出推理模型系列Magistral,包括Magistral Small和Magistral Medium两个版本,提升在数学、物理等学科领域的逻辑推理能力。Magistral Small版拥有240亿个参数,已在Hugging Face开放下载。模型适用于多种企业级应用场景,支持多语言,答题速度快。
Vast Data目标250亿估值:AI存储市场机遇凸显
AI存储公司Vast Data筹备新一轮融资,目标估值250亿美元(较2023年90亿翻倍)。其统一存储平台消除层级划分,支持CPU/GPU混合计算,客户包括皮克斯、CoreWeave等。2023年ARR达2亿美元,年增长2.5-3倍,连续四年正现金流。竞品包括Pure Storage(市值170亿),同时开发数据库架构挑战Databricks。
扎克伯格组建”超级智能”团队,Meta发力AI领域突破
Meta创始人扎克伯格因对Llama4表现失望,组建”超级智能小组”以实现通用人工智能(AGI)。亲自参与团队组建,成立高管群挖掘人才,提供高薪吸引顶尖研究人员。计划投资数据标注公司Scale AI,其创始人或加入新团队。调整总部办公布局,计划将AI整合进社交产品和智能设备,未来几年投入数千亿美元。
Snap计划2026年发布第六代AR眼镜Specs:搭载Gemini AI
Snap宣布2026年推出第六代AR眼镜Specs,支持谷歌Gemini AI,运行自研Snap OS,较前代更轻小。2024年Spectacles开发者版月租99美元,新版将面向消费者。竞品包括苹果Vision Pro(3500美元)、Meta猎户座AR眼镜,谷歌联合Warby Parker推新品,智能眼镜市场竞争白热化。
AI Navi应用显著提升低技能出租车司机效率
日本东京大学研究发现,AI工具在低技能出租车司机中应用效果显著。横滨市的AI Navi应用通过预测需求高峰和推荐路线,使低技能司机生产力提高约7%,而高技能司机表现变化不大,显示AI可缩小技能差距,但部分司机对新技术接受度仍不足。
苹果图乐园升级:整合ChatGPT生图功能,新增吉卜力风格
iOS26/macOS26系统图乐园新增ChatGPT图像生成能力,支持吉卜力、油画等10余种风格,用户可文本描述或上传照片生成。免费用户每月限次,生成速度较慢(需授权数据至ChatGPT服务器),但内容限制更宽松(如允许暴力元素)。苹果会标注”由ChatGPT生成”,付费用户可获更多创作机会。
特斯拉Robotaxi项目在奥斯汀启动测试
特斯拉计划在奥斯汀推出Robotaxi服务,使用搭载最新FSD无监督系统的Model Y,初期以10辆车小规模测试,未来将扩大规模并拓展至其他城市。尽管市场和监管机构对其安全性和技术成熟度存疑,但该项目仍标志着特斯拉在无人驾驶技术领域迈出重要一步。
苹果发布AI模型更新,强调设备端能力【人工验证】【可能?伪人资讯】
苹果发布AI模型更新,支持Apple Intelligence功能。设备端模型约30亿参数,可在iPhone运行,无需互联网,文本生成质量与谷歌、阿里相当。但服务器端模型不敌OpenAI GPT-4o,图像分析能力不如Meta Llama4Scout。更新模型支持多种文本处理功能和15种语言。尽管苹果努力,市场竞争激烈,用户对Siri升级失望,部分消费者提起诉讼。
发烧友(研究)
PartCrafter革新3D建模,单张图像生成结构化3D模型【人工查证】
由北京大学、字节跳动和卡内基梅隆大学联合研发的PartCrafter项目发布,可从单张RGB图像生成高精度结构化3D模型,无需预分割输入。其核心创新包括组合式潜在空间和层次化注意力机制,具备“透视”能力可推断不可见结构。该技术在效率和质量上超越传统两阶段方法,构建大规模3D数据集支持部件级生成,在游戏开发、虚拟现实等多领域具有应用前景。
精确调节模型”思考”方式【人工查证】
伊利诺伊大学香槟分校和加州大学伯克利分校联合开发的AlphaOne框架,通过α参数精准控制模型”先慢后快”思考策略:在α时刻前插入”Wait”标记深度推理,临界点后强制快速生成答案。实验显示,该框架在数学/代码生成等任务中准确率提升6.15%,token使用量减少21%,特别适合企业复杂查询与代码生成场景。代码即将开源,集成仅需简单配置。
阿里开源MaskSearch预训练框架,AI主动搜索多步推理【人工查证】
阿里通义实验室开源了MaskSearch预训练框架,通过检索增强掩码预测(RAMP)方法和强化学习技术,提升AI在复杂问题解决中的表现。该框架让AI学会主动搜索与多步推理,显著提升了其在多步推理任务中的表现。MaskSearch的开源为全球开发者提供了低门槛的实验平台,有望加速智能搜索和推理技术在多个领域的应用。
Figma推出Dev Mode MCP服务器Beta版,设计到代码一键转换
Figma宣布推出Dev Mode MCP服务器Beta版,通过标准化协议将设计数据直接传递给AI编码工具,提升了设计到代码的转换效率与准确性。该服务支持与多种AI编码工具无缝集成,包括VS Code with Copilot、Cursor等。目前仅对持有Dev或Full Seat许可的用户开放,未来计划推出远程服务器功能和更深入的代码库集成。
多维进展,
全球首个临床AI放射系统问世,效率提升80%
美国西北大学医学院研发的生成式人工智能放射系统嵌入临床流程,能在毫秒内识别危及生命的病症。系统已在西北大学所属12家医院部署,提升报告生成效率,具备实时预警功能。训练数据来自医疗系统内部真实临床资料,目标是提升效率而非取代医生。
高通发布骁龙 AR1+ Gen 1处理器,支持设备端AI
高通公司发布了全新的骁龙 AR1+ Gen 1处理器,专为智能眼镜设计。该处理器实现了设备端人工智能的直接支持,使用户无需依赖智能手机或云端即可享受便捷的AI服务。相比前代产品,新款处理器体积减小28%,功耗降低7%,显著提升了智能眼镜的续航能力。高通还提到与Meta合作的智能眼镜项目,预计将推动轻薄的AI+AR眼镜的发展。
有点意思~
老凤祥进军AI眼镜市场,推出中老年专属智能眼镜
老凤祥宣布进军AI科技领域,推出首款专为中老年群体设计的智能眼镜,搭载豆包大模型,集成拍照、AI识物、导航和日程管理功能。该产品采用半框设计,将于6月11日至13日在上海老博会亮相。作为传统珠宝企业跨界尝试,面临技术成熟度、用户接受度和市场竞争等多重挑战。
暂无评论内容