AI

《视频大模型“造梦机器”:瑕疵虽多,实用性获认可》

视频大模型“造梦机器”近期在网络上迅速走红,尽管存在一些瑕疵,但其功能性和实用性得到了用户的认可。这款模型能够帮助用户创造出独特的视频内容,虽然技术上还有待完善,比如画面质量、流畅度等方面可能不尽人意,但它已经能够满足一部分用户的基本需求。随着技术的不断进步,相信“造梦机器”未来将能提供更加优质的服务,满足更多用户的需求。原文链接
AI

阿里云最近公布了他们的开源模型Qwen2。

Qwen2 大型模型已经发布,并且在 Hugging Face 和 ModelScope 上同步开源。这是 Qwen1.5 系列模型的重大升级,包括了 5 个不同尺寸的预训练和微调模型。Qwen2 在训练数据中增加了 27 种语言相关的高质量数据,并且支持更长的上下文长度,最高可达到 128K tokens。Qwen2 相比 Qwen1.5 在大规模模型上实现了显著的效果提升,在多项能力上都超越了当前领先的开源模型。在自然语言理解、知识、代码、数学及多语言等方面都取得了显著的成绩。此外,Qwen2 还采用了不同的模型许可,其中大部分采用 Apache 2.0 许可。
AI

腾讯混元发布了一个开源的加速库,可以将生成图片所需的时间缩短 75%。

腾讯今天宣布推出了针对混元 DiT 模型的加速库,据称可以显著提高推理效率,缩短生成图像的时间约 75%。官方表示,混元 DiT 模型的使用门槛也大幅降低,用户可以通过 ComfyUI 的图形化界面轻松使用腾讯混元文生图模型能力。 此外,混元 DiT 模型已经整合到 HuggingFaceDiffusers 通用模型库中,用户只需三行代码即可调用该模型,无需下载原始代码库。 此前,腾讯已经宣布对混元文生图大模型进行了全面升级,并对外开源,供企业和个人开发者免费商用。
AI

面壁智能宣布他们的 MiniCPM 现在可以免费商用。

面壁智能宣布,从现在开始,MiniCPM和MiniCPM-V的权重将对学术研究完全开放,并且企业和个人在填写问卷登记后也可以商业使用。社区使用MiniCPM系列模型需要遵守Apache 2.0和《MiniCPM模型社区许可协议》。 此前,有报道称斯坦福大学的AI团队抄袭了面壁智能于五月中旬发布的8B多模态小模型MiniCPM-Llama3-V 2.5。这一事件曾登上微博热搜,最终以斯坦福Llama3-V团队的两位作者道歉结束。