新的突破!
可灵2.1上线,价格降65%
可灵2.1版本正式上线,价格下调65%,新增标准版、高品质版与大师版三种质量模型,生成效果超越前版本,速度更快,适合短视频和广告制作。【短评】这个请务必看看,爆炸性的NB。【注意】只支持图生视频。
模态媲美GPT-4o
蚂蚁集团(阿里)开源Ming-lite-omni多模态模型,拥有220亿参数,性能与10B量级领先的多模态大模型相当,是首个在模态支持方面能与GPT-4o相媲美的开源模型。
重要动向:
xAI与电报达成3亿美元合作
马斯克的xAI与Telegram达成3亿美元合作协议,xAI支付3亿美元部署Grok AI聊天机器人,将集成多种AI功能至Telegram平台,惠及10亿用户。
国内影像行业首个获官方资质的应用级图像大模型
像素蛋糕自主研发的’方糖大模型’通过国家网信办备案,成为国内影像行业首个获官方资质的应用级图像大模型,将在广告、影视等领域推动行业发展。
发烧友(研究)
Meta发布Multi-SpatialMLLM模型
Meta与香港中文大学合作推出Multi-SpatialMLLM模型,通过深度感知、视觉对应和动态感知三大组件,显著提升多模态大语言模型的空间理解能力,超越传统模型表现。
降低88%LLM训练成本
通义实验室、北大发布ZeroSearch,通过模拟搜索引擎,无搜索即可激活LLM检索能力,大幅降低训练成本达88%,提升模型推理清晰度与答案提取效率,性能优于传统方法。【注意】项目地址加载慢,打不开是因为魔法问题。
Resemble AI开源TTS Chatterbox模型
Resemble AI开源TTS Chatterbox模型基于0.5B规模的LLaMA架构,训练数据超50万小时,在盲测中63.75%的听众更偏好其真实感和流畅度,性能直逼超越ElevenLabs。【注意】项目地址加载慢,打不开是因为魔法问题。
国内企业
抖音智能体小云雀发布
字节跳动推出“小云雀AI”,用户只需一句指令,即可生成爆款视频与图片,实现“灵感即所得”。【短评】功能集成的很多,看着可以,实际体验有部分地方达不到预期,不过至少能用。【注意】只有安卓版本,IOS预计六月上线。
字节推出AI剪辑应用”剪小映”
字节跳动推出”剪小映”AI视频剪辑应用,集成AI技术降低视频创作门槛,火山引擎豆包大模型提供技术支持,实现高质量视频轻松创作。
有点意思~
Paper2Poster学术论文转学术海报工具
Paper2Poster开源工具通过自动化技术将学术论文转化为多模态海报,生成成本低至0.005美元,效率远超传统手动方式,推动学术传播效率。
暂无评论内容