【AI日报·6/8】多领域突破—2025刊

优质活动=

每日百万免费Token,支持多种模型

Cerebras Systems宣布其推理API全面开放,开发者每日可获100万免费Token。该API在速度上显著优于传统GPU解决方案,尤其在实时语音、视频处理等场景表现出色,支持多种主流开源模型,并与Hugging Face和Meta等平台合作。【短评】主要核心在数据隐私,这势必是一场观念性颠覆的“战争”。脑机接口是心猿社非常希望你去了解的领域。【注意】某些网址加载慢,打不开是因为魔法问题。

新的突破!

中国脑机接口临床入组加速

2025 年中国脑机接口技术临床应用加速,多地布局产业。华山医院等牵头脑机接口临床研究,清华团队 NEO 设备助瘫痪患者恢复运动功能,专家强调需解决安全性和伦理问题。【短评】主要核心在数据隐私,这势必是一场观念性颠覆的“战争”。脑机接口是心猿社非常希望你去了解的领域。【注意】某些网址加载慢,打不开是因为魔法问题。

允许上传和混音未完成的作品

Suno新升级的AI音乐编辑工具允许多人上传和混音未完成音乐作品。此外,Suno面临来自索尼、环球和华纳等唱片公司的版权诉讼,唱片公司希望引入Content ID技术追踪音乐使用,而Suno去年融资1.25亿美元,估值达5亿美元。【短评】总算是上线这个功能了,按理说这对Suno不难。【注意】某些网址加载慢,打不开是因为魔法问题。

无需3D模型生成真实运动视频

谷歌DeepMind与布朗大学合作开发“力提示”技术,用户通过指定力的方向和强度操控视频内容,无需3D模型和物理引擎,显著提高视频生成的真实感和动态表现。【短评】AI视频与物理学一直是核心的攻坚方向,目前还是有许多不足。【注意】某些网址加载慢,打不开是因为魔法问题。

Chatgpt升级,增进企业化

OpenAI 面向商业用户推出新功能,ChatGPT 可连接 Outlook、Teams、Gmail、Google Drive 等服务,支持企业 IT 管理员构建自定义连接器,macOS 版 ChatGPT Team 用户新增“录制模式”,未来将向更多用户开放。【短评】其实核心就是接入了MCP。【注意】某些网址加载慢,打不开是因为魔法问题。

32+语言无缝切换,AI音频

ElevenLabs 发布 Conversational AI2.0 平台,引入轮流对话模型识别语气词判断意图;支持 32 + 语言无缝切换,有自动语言检测功能;集成 RAG 技术可提取企业知识库信息;有批量通话功能,助企业向众多客户发个性化通知等。【短评】AI音频最近到了爆发期?【注意】某些网址加载慢,打不开是因为魔法问题。

和自己喜欢的角色,身临其境地对话

Character.ai发布的新功能中,「Scenes」、「AvatarFX」、「Profile Redesign」已分别上线移动端、网页端及移动端,创作者工具将在今夏晚些时候登场;此外,可观看角色动态互动的「Streams」、仅对c.ai +订阅者开放的「Imagine Animated Chats」(移动端可用)以及串联所有新功能的「Community Feed」也将陆续上线移动端,为用户提供更丰富的沉浸式互动体验和展示平台。【短评】Character主打的是AI角色扮演,相当于一个特训模型。【注意】某些网址加载慢,打不开是因为魔法问题。

AI语音,感知你的情绪,对标GPT-4o

Hume AI 发布的第三代语音交互模型 EVI3,能精准识别用户语音情绪,生成特定风格声音和个性,推理延迟低至 300 毫秒,响应速度优于 GPT – 4o。【短评】AI语音情绪感知是很重要的,就像一个词用不同的发音会有不同的意思。【注意】某些网址加载慢,打不开是因为魔法问题。


思维必看

世界正在以前所未有的速度被改变

“互联网女皇”Mary Meeker发布报告,指出AI以史无前例的速度发展,用户增长、使用量、资本支出、技术迭代、竞争格局、商业模式、工作变革等多方面快速演进,影响深远。【短评】很值得读的报告,算是对AI的一个总结。【注意】某些网址加载慢,打不开是因为魔法问题。

支持智能手机离线 AI 处理

谷歌推出了一款名为 AI Edge Gallery 的实验性 Android 应用,用户无需互联网连接,可在智能手机上直接运行复杂的人工智能模型,增强用户隐私保护。【短评】主要还是性能问题,而且…安卓的安全性本身就…【注意】某些网址加载慢,打不开是因为魔法问题。

ChatGPT 高级语音模式广告插播引质疑

一名 ChatGPT 付费用户在使用高级语音模式时,突然被转入 Prolon 营养计划广告宣传,用户质疑服务质量。其他用户测试发现类似广告插播情况,OpenAI 技术人员称是幻觉,会改进提升体验。【短评】“幻觉”…猜猜为什么会有这样的“幻觉”?哥们,人家还是付费用户啊!当日本人整啊?广告问题一定会是未来的大问题。【注意】某些网址加载慢,打不开是因为魔法问题。

Meta 公司计划将 90% 风险评估交由 AI 负责,引安全隐忧

Meta 宣布要将内部安全和隐私审查工作的 90% 自动化,由 AI 系统评估风险并设定条件,但专家担忧此举会削弱人类审查力度,导致更高的风险。【短评】属实是为了降本增效不管不顾了,现在AI绝对没达到自动化审查的程度。


国内动向*

中国水利部推出“水利标准AI大模型”

中国水利部推出“水利标准AI大模型”,集成丰富水利资源,实现标准全生命周期智能化管理,显著提升编制、评估和检索效率,推动水利标准化发展。【短评】有点意思呀!

小米转让Kimi商标

小米科技将2013年申请、涉及通讯服务等国际分类的多枚“Kimi”商标转让给北京月之暗面科技。月之暗面科技成立于2023年4月,已推出Kimi智能助手。分析称小米此举是优化非核心商标资源,月之暗面获商标后利于拓展智能助手业务。【短评】唉,Kimi现在其实能感觉到在走下坡路,主要还是没有豆包那样的财力,易用性开发困难。


国外资讯:

微软必应推出AI视频创作工具

微软必应集成 OpenAI Sora 模型驱动的 Bing Video Creator,用户可文本提示免费生成短视频,目前仅支持移动设备,免费生成 10 段视频后需付费。【短评】必应…国内现在还有人用吗?

谷歌Gemini Live正式支持iOS平台

谷歌 Gemini Live 功能登陆 iOS 和 iPadOS 平台,支持 AI 识别场景和屏幕内容,免费使用,仅限美国地区用户。【短评】就类似豆包智谱清言的视频通话,但这个还能识别屏幕内容。

Figure重组

人形机器人公司Figure于近期宣布完成公司历史上规模最大的组织架构调整,将三大独立技术团队整合进新成立的AI核心小组Helix。这一战略重组旨在打破部门壁垒,加速人形机器人的商业化进程。Figure创始人兼CEO Brett Adcock在推特上宣布了这一消息,但他并未透露具体的人事变动细节。【短评】就类似豆包智谱清言的视频通话,但这个还能识别屏幕内容。

三星与Perplexity合作

三星正与AI搜索服务提供商Perplexity洽谈合作,计划将Perplexity深度集成到Galaxy S26的核心功能中,可能使其成为默认AI助手,这一举措或对谷歌主导的移动AI格局构成挑战。【短评】这步棋走的很对,AI竞争中,硬件才是锁定胜局的关键;三星的大模型是一定在研发的,而Perplexity对比谷歌相对弱势,这种过渡是为未来的三星大模型做铺垫。

Console获620万美元融资

Console获620万美元种子融资,其AI工具可自动化IT帮助台的基本任务,如重置密码、授权应用访问等,通过与Slack集成,快速为员工提供服务,提升IT工作效率。【短评】Console主要在AI自动化上下功夫,宣传是IT工作者的AI伙伴。心猿社的AI金选工具箱中也有关于自动化的工具,在极客/发烧友板块。【注意】某些网址加载慢,打不开是因为魔法问题。

软银英特尔合作,新型芯片有望减半电力消耗

软银与英特尔合作开发新型AI专用内存芯片,预期电力消耗降低约50%。该芯片由新公司Saimemory设计,计划两年内完成原型开发,项目预计投资100亿日元,软银为主要投资方。【短评】希望英特尔能够东山再起吧,AI算力仍然是竞争中的核心。

Meta计划用AI实现广告创作全面自动化

Meta正开发先进AI工具,目标明年年底让品牌完全通过AI创作和投放广告。此举旨在提高广告创作效率和精准度,降低对专业广告团队的依赖,同时在AI创作和人类创意间寻求平衡。


发烧友(研究)

OpenAI Codex CLI从Node.js迁移到Rust语言重写

OpenAI宣布将其AI编程工具Codex CLI从Node.js迁移到Rust语言重写。OpenAI Codex CLI是一个开源命令行工具,它直接在终端中引入了我们最新的推理模型。它作为一个轻量级的编码代理,可以读取、修改和运行本地机器上的代码,帮助你更快地构建功能、修复错误,并理解不熟悉的代码。【注意】某些网址加载慢,打不开是因为魔法问题。

低成本实现图像一致性

OmniConsistency:低成本图像风格化一致性框架,仅需2600对图像+500小时GPU即可实现商业级风格迁移;模块化架构原生兼容LoRA,无缝集成现有工作流;突破生成一致性瓶颈,推动开源AI艺术工具发展。【注意】某些网址加载慢,打不开是因为魔法问题。


有点意思~

黄仁勋:一个小目标,五万亿

英伟达CEO黄仁勋分享推动公司未来增长的四大AI趋势——推理AI、AI普及、企业AI和工业AI。推理AI取得突破,英伟达的处理器组合成为理想引擎;AI普及政策调整,更多国家可利用AI技术。【短评】又开始吹NB了,具体还是看英伟达能不能维持住垄断地位。

Suno AI助失声歌手重现完美嗓音

一位因神经性失声的歌手通过Suno AI的“掩护”工具,将受损录音转化为清晰强劲的声乐表演。该工具结合深度学习和语音合成技术,从有限输入中提取关键音乐元素,生成高质量声乐作品,为身体障碍者重返艺术舞台提供可能。【短评】唉,想起大同了,现在B站上应该有不少AI方大同唱歌,可以去听一听。【注意】某些网址加载慢,打不开是因为魔法问题。

犹他州律师因 ChatGPT 虚假案例被处罚

美国犹他州律师理查德・贝德纳因在法庭文件中引用 ChatGPT 生成的虚假案例遭制裁。法庭强调律师责任,贝德纳被罚款并捐款,事件引发对 AI 在法律领域应用的讨论。【短评】秀,铁头娃。【注意】某些网址加载慢,打不开是因为魔法问题。

内幕暴露:苹果虽握类 ChatGPT 十五亿参数 AI 模型却暂不发布

苹果内部存在 30 亿、70 亿、330 亿和 1500 亿个参数的多款 AI 模型,其中 1500 亿参数模型性能媲美 ChatGPT,但仅限内部测试,且 Siri 等多个 AI 项目进展受阻。【短评】这大概率是准备发了,这不,开始营销了…


心猿社相关.

快报:AI金选工具箱正式上线啦!以用户需求出发,免费好用工具的聚集地!

捧哏:我现在就要爽用!

提醒:您所看到的超链接(如心猿社)的实现是我们自己手搓的插件,目前还有许多需要优化的地方(比如白名单,黑名单功能等),所以有的地方视觉体验还不那么好,见谅呀。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容