新的突破!
免费,媲美o3,128K上下文
DeepSeek R1-0528发布:免费128K上下文,推理性能直逼OpenAI o3!代码生成与写作能力大幅提升,几乎对标OpenAI!【短评】免费,伟大无需多言。【注意】项目地址打不开是因为魔法问题。
模态媲美GPT-4o
蚂蚁集团(阿里)开源Ming-lite-omni多模态模型,拥有220亿参数,性能与10B量级领先的多模态大模型相当,是首个在模态支持方面能与GPT-4o相媲美的开源模型。
重要动向:
首款AI代理浏览器
Opera Neon作为全球首款”完全代理型”浏览器,集成AI助手Neon Chat支持多语言交互,Neon Make可通过简单指令生成内容,实现任务自动化。【短评】其实代理浏览器,现在智谱清言的Auto沉思就可以用。【注意】内测中,测试不了,不放最新突破。
xAI与电报达成3亿美元合作
马斯克的xAI与Telegram达成3亿美元合作协议,xAI支付3亿美元部署Grok AI聊天机器人,将集成多种AI功能至Telegram平台,惠及10亿用户。
OpenAI重组准备IPO
OpenAI正在重组组织架构,为可能的首次公开募股(IPO)做准备,微软已投资超过130亿美元,OpenAI转型为公共利益公司,平衡股东回报与社会责任。【短评】就是要商业化。
国内影像行业首个获官方资质的应用级图像大模型
像素蛋糕自主研发的’方糖大模型’通过国家网信办备案,成为国内影像行业首个获官方资质的应用级图像大模型,将在广告、影视等领域推动行业发展。
发烧友(研究)
Meta发布Multi-SpatialMLLM模型
Meta与香港中文大学合作推出Multi-SpatialMLLM模型,通过深度感知、视觉对应和动态感知三大组件,显著提升多模态大语言模型的空间理解能力,超越传统模型表现。
降低88%LLM训练成本
通义实验室、北大发布ZeroSearch,通过模拟搜索引擎,无搜索即可激活LLM检索能力,大幅降低训练成本达88%,提升模型推理清晰度与答案提取效率,性能优于传统方法。【注意】项目地址加载慢,打不开是因为魔法问题。
Resemble AI开源TTS Chatterbox模型
Resemble AI开源TTS Chatterbox模型基于0.5B规模的LLaMA架构,训练数据超50万小时,在盲测中63.75%的听众更偏好其真实感和流畅度,性能直逼超越ElevenLabs。【注意】项目地址加载慢,打不开是因为魔法问题。
国内企业
抖音智能体小云雀发布
字节跳动推出“小云雀AI”,用户只需一句指令,即可生成爆款视频与图片,实现“灵感即所得”。【短评】功能集成的很多,看着可以,实际体验有部分地方达不到预期,不过至少能用。【注意】只有安卓版本,IOS预计六月上线。
字节推出AI剪辑应用”剪小映”
字节跳动推出”剪小映”AI视频剪辑应用,集成AI技术降低视频创作门槛,火山引擎豆包大模型提供技术支持,实现高质量视频轻松创作。
有点意思~
Paper2Poster学术论文转学术海报工具
Paper2Poster开源工具通过自动化技术将学术论文转化为多模态海报,生成成本低至0.005美元,效率远超传统手动方式,推动学术传播效率。
暂无评论内容