【AI日报·6/9】已校验—2025刊

社内要情速递·

通用AI横向测评工作完成!

我们需要一个动态实时的AI资讯与测评的平台;我们还需要一个测评工具好不好用的,接地气的平台。【AI省流日报+横向测评+最新进程】联动板块完成(偷偷插一句,它还可以和AI金选工具箱联动哦~


新的突破!

Gemini2.5Pro在长文本理解测试中超越o3模型

Gemini2.5Pro在Fiction.Live基准测试中表现卓越,尤其在处理长文本时,其准确率远超OpenAI的o3模型。测试显示,o3在上下文窗口扩展至192K词条时性能大幅下滑,而Gemini2.5Pro仍能保持超过90%的准确率,这表明其在深层语义理解和背景依赖信息处理方面具有显著优势。【注意】某些网址加载慢,打不开是因为魔法问题。

Grok与Neuralink合作帮助渐冻症患者发声

马斯克旗下的Neuralink与Grok合作,开发出一项帮助渐冻症患者“用意念发声”的技术。通过脑机接口芯片,患者能够用思维控制光标输入文字,Grok助手自动补全语句,并利用语音克隆技术还原患者的声音,使患者能够“开口说话”。【注意】某些网址加载慢,打不开是因为魔法问题。

ChatGPT语音模式重大更新,对话更自然流畅

OpenAI对ChatGPT语音模式进行升级,依托多模态模型,使其响应更迅速,语调、停顿和情绪表达更细腻自然,新增实时翻译功能,但音频质量和意外声音等问题仍待解决。【短评】意外声音是指广告。【注意】某些网址加载慢,打不开是因为魔法问题。

文档解析 MonkeyOCR 凭 3B 小模型超越 Gemini

MonkeyOCR 凭借 3B 参数的轻量级架构,在多项英文文档解析任务中超越 Gemini2.5Pro 等大模型,其 “结构 – 识别 – 关系” 三元组范式提升解析准确率,且每秒 0.84 页的解析速度远超同类,为文档解析领域树立新标杆。【短评】文档解析到现在也没有一个解决的很好的,这是通用AI应该下功夫的地方。【注意】某些网址加载慢,打不开是因为魔法问题。


国内动向*

即梦图片3.0智能参考功能全量上线

字节跳动旗下AI创作平台即梦AI推出即梦图片3.0的智能参考功能,用户可通过上传参考图片和输入文本提示生成特定风格的设计作品。该功能在中文文本理解和生成方面表现出色,适用于电商、短视频等多种场景,且具有强大的主体一致性,细节保留至“头发丝级别”。平台的积分机制降低了创作门槛,用户可免费进行大量尝试。【短评】电商,设计神器,心猿社决定立马使用~

智谱 AI 推出企业级超级助手 Agent CoCo

智谱 AI 上线 Agent CoCo,以交付为导向,具记忆机制与系统嵌入能力,助力企业工作流程智能化,从办公到决策全方位提升效能,增强员工满意度。【短评】智谱清言到底在干什么?又是牛牛又是CoCo的,能不能统一一下???

国产智能机器人全场景应用于汽车制造

东风柳州汽车有限公司与智平方科技合作,将具身大模型 VLA 的通用智能机器人 AlphaBot2 应用于汽车制造的多个生产环节,如上下料、拖拽料车等,推动智能制造发展,彰显国产智能机器人技术的成熟。

上海财大发布匡时财经教育大模型

上海财经大学推出 “匡时财经教育大模型”,整合财经教育资源,构建知识图谱,依托算力集群与评测体系,推动财经教育智能化,与企业共建创新平台,深化产学研合作。【短评】算不上大的进展,但总归是好事。

通义千问3大模型开源下载量突破1250万==

阿里通义千问3大模型开源一个月,全球下载量超1250万次,衍生模型超13万个。其0.6B、8B、30B和32B版本在Hugging Face等平台广受欢迎,应用于代码助手、智能客服、Agent开发等领域,显示出国产大模型的开源实力与广泛应用潜力。【短评】对于金融,主要还是数据分析和做量化吧?【注意】某些网址加载慢,打不开是因为魔法问题。

百度发布金融行业大模型千帆慧金

百度智能云推出针对金融行业的千帆慧金大模型,旨在为金融机构提供精准高效的人工智能解决方案。该模型基于海量金融数据训练,确保了专业性和可靠性。百度强调,未来AI竞争将聚焦于智能体的构建,以提升自主决策和任务处理效率。【短评】对于金融,主要还是数据分析和做量化吧?【注意】某些网址加载慢,打不开是因为魔法问题。

国产智能机器人在汽车制造全场景应用启动==

东风柳州汽车有限公司与智平方科技达成合作,国产具身大模型VLA GOVLA首次应用于汽车制造全场景。搭载该模型的AlphaBot2机器人将在东风柳汽工厂承担上下料、拖拽料车、贴标签等任务,覆盖质量检测、装配、物流转运及运维等环节,推动汽车制造智能化转型。【短评】对于金融,主要还是数据分析和做量化吧?【注意】某些网址加载慢,打不开是因为魔法问题。


国外资讯:

英国电影协会警告:AI技术侵害影视行业版权,构成直接威胁

英国电影协会(BFI)报告指出,AI公司未经许可使用超130,000个影视剧本训练模型,侵犯版权并对英国屏幕行业构成威胁。报告分析了AI带来的好处与挑战,指出AI可能削弱商业模式和取代技术工人。BFI研究与创新总监表示,AI在提高生产效率和创作自由度方面的潜力巨大,但也存在隐患。报告建议建立知识产权许可市场等九项措施,政府承诺遵循支付创作者原则。【短评】并非“可能”。

Google Veo 3推出FAST/TURBO模式,性价比大幅提升

Google Veo 3新增FAST/TURBO模式,成本降低80%,性价比提升五倍。该模式支持原生音频生成,可直接从文本生成含对话、音效和背景音乐的视频,生成时间缩短30%,适合短视频、社交媒体内容和快速原型设计。【短评】这说明都是冲着新闻去的,目前最好用的AI工具仍然是OpenAI的;国内则是豆包【注意】某些网址加载慢,打不开是因为魔法问题。

Gemini应用下载量超ChatGPT,活跃度待提升

谷歌Gemini应用月下载量超越ChatGPT,每周安装量达600万以上,但用户活跃度仅为4.9%,远低于ChatGPT的42.52%,未来需提升用户日常使用率。【短评】这说明都是冲着新闻去的,目前最好用的AI工具仍然是OpenAI的;国内则是豆包【注意】某些网址加载慢,打不开是因为魔法问题。

美国拟禁止州级AI法规,消费者保护引担忧

美国国会共和党提议十年州级AI法规禁令,旨在简化法律框架,但反对者担心这将限制消费者保护和工人权益法律的实施,引发公众对科技巨头权力扩张的担忧。【短评】主要还是监管没有利益驱使,你看知网不就推出了AIGC检测嘛。【注意】某些网址加载慢,打不开是因为魔法问题。

英国金融监管局与Nvidia合作,启动AI创新“超级沙盒”计划

英国金融行为监管局(FCA)宣布“超级沙盒”计划,允许金融公司在监管环境中试验Nvidia的AI产品。该项目旨在推动金融领域技术进步,可用于识别和防止诈骗及股市操纵等问题。FCA首席数据官表示,合作将支持企业利用AI为市场和消费者带来益处。Nvidia强调,AI正在改变金融行业,超级沙盒提供安全探索环境。【短评】不亏是英国,这居然敢放开?

Mistral AI拟融资10亿美元

法国AI初创公司Mistral AI迅速崛起,年营收有望突破1亿美元,客户群体不断扩展。该公司计划进行10亿美元的融资,以支持研发和业务拓展。作为开源大模型阵营的代表,Mistral AI凭借其技术实力和商业模式,成为欧洲AI生态的重要力量。【短评】当年号称欧洲的“OpenAI”。【注意】某些网址加载慢,打不开是因为魔法问题。

Runway AI电影节在纽约开幕

Runway AI电影节在纽约盛大开幕,吸引了约6000部短片参赛,最终评选出十部优秀作品展映。这些作品融合了AI技术和真人拍摄元素,展现了AI视频技术的创新应用。电影节的成功举办体现了AI在创意视频领域的巨大潜力。【注意】某些网址加载慢,打不开是因为魔法问题。

苹果在AI竞赛中面临挑战,WWDC成关键转折点

苹果在AI领域的发展相对滞后,此前承诺的多项AI功能未能如期实现,导致其在市场竞争中处于被动。即将到来的WWDC被视为苹果挽回信任的关键机会,分析人士预计苹果可能会宣布与更多GenAI合作方达成协议,以弥补技术短板。【短评】确实挺奇怪的,AI竞争中,国内最有希望的是华为,国外实际上是苹果,结果这两个都挺“闷”的,但是只要芯片,手机,电脑在手,它们仍然是最有希望的。【注意】某些网址加载慢,打不开是因为魔法问题。


发烧友(研究)

全球首个开源VLA大模型GroceryVLA发布,推动零售行业未来

银河通用机器人发布GroceryVLA大模型,展示无人遥控自主操作能力。Galbot G1在商超场景中实现自主商品识别与抓取,具备强适用性、通用性、跨场景泛化能力、自主决策能力和抗干扰性。同时发布OpenWBT系统,简化人形机器人部署流程,降低技术门槛。【注意】某些网址加载慢,打不开是因为魔法问题。

Dify智能体实现微信天气助手,便捷获取好友天气信息

开发者利用Dify平台和MCP技术创建微信自动发送天气信息的智能助手。开发过程包括搭建MCP Server应用、使用wxauto库实现微信自动化操作、创建获取天气的MCP Server等。用户可输入城市查询实时天气数据,通过语音指令整合天气查询与微信消息发送功能,展示AI技术在日常生活中的应用【注意】某些网址加载慢,打不开是因为魔法问题。

苹果研究发现推理模型在复杂任务下崩溃

苹果研究人员发现,一些专为“模拟思维过程”设计的推理模型在解决复杂任务时表现不佳,甚至出现性能崩溃。这些模型在高复杂度任务下不仅准确率下降,还减少了推理标记的使用,显示出其在扩展性上的根本缺陷。【短评】是这样的,实际上推理模型还远没有我们想得那么完美。【注意】某些网址加载慢,打不开是因为魔法问题。

北邮推出MemoryOS,破解AI“失忆”难题

北京邮电大学发布MemoryOS记忆操作系统,采用三级存储架构,提升AI多轮对话连贯性与一致性,显著提高长期对话记忆能力,降低计算资源消耗。【短评】是这样的,实际上推理模型还远没有我们想得那么完美。【注意】某些网址加载慢,打不开是因为魔法问题。

Hugging Face开源LeRobot

Hugging Face推出开源项目LeRobot,统一硬件接口适配多款设备,内置海量预训练模型和标准化数据集加载工具,支持记忆迁移和智能评估,加速AI机器人开发进程。【注意】某些网址加载慢,打不开是因为魔法问题。

Google AI Studio调整政策,Gemini2.5Pro免费访问受限

Google AI Studio自5月起停止向免费用户提供Gemini2.5Pro系列模型调用权限,转向基于API密钥的使用系统。开发者仍可免费使用Gemini2.0系列,但性能差距明显。此举或推动Gemini商业化,未来开发者需在性能与成本间权衡。【注意】某些网址加载慢,打不开是因为魔法问题。


有点意思~

复古游戏机Atari 2600在国际象棋对战中击败现代AI ChatGPT

基础架构师罗伯特·卡鲁索进行实验,将ChatGPT与Atari 2600的国际象棋引擎对战。结果Atari 2600获胜,ChatGPT在初学者水平对局中频繁犯错,混淆棋子和失去棋盘意识。尽管卡鲁索干预,ChatGPT表现未改善。这场对决引发了复古科技与现代AI的讨论。【注意】某些网址加载慢,打不开是因为魔法问题。

高考数学大赛:豆包与元宝夺冠

六大AI模型参加高考数学大赛,豆包和元宝并列第一,展现出色推理能力,各模型在单选题、多选题和填空题表现不一,整体推理和逻辑能力较去年有显著提升。【注意】某些网址加载慢,打不开是因为魔法问题。


心猿社相关.

快报:AI金选工具箱正式上线啦!以用户需求出发,免费好用工具的聚集地!

捧哏:我现在就要爽用!

提醒:您所看到的超链接(如心猿社)的实现是我们自己手搓的插件,目前还有许多需要优化的地方(比如白名单,黑名单功能等),所以有的地方视觉体验还不那么好,见谅呀。

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容