????大模型动态
阿里开源AnyText
阿里开源多语言视觉文字生成与编辑模型——AnyText,AnyText对生成文字的把控可媲美专业PS,用户可自定义规划文字出现的位置,图片的强度、力度、种子数等,目前在Github超2,400颗星非常受欢迎。
英伟达推新AI语音识别模型Parakeet
NVIDIA NeMo宣布推出Parakeet ASR模型系列,这是一系列先进的自动语音识别(ASR)模型,与Suno.ai合作开发。
???AI应用
视频生成工具Pika推出付费计划,提供不同档次选择
Pika宣布推出付费计划,分为两个档次,分别为10美元和60美元。免费版本有水印,300积分生成60个视频,而付费版本消除水印,10美元版本可生成210个视频,60美元版本提供500个视频生成数量和额外功能。用户可根据需求选择不同档次,享受Pika提供的优质服务。
Magnific AI本周更新!可将图片放大至10K*10K分辨率
AI创始人Javi Lopez在推特宣布,Magnific AI将于本周更新,可将图片放大至10K*10K分辨率。
强大人工智能编码助手code AI
code AI是一款强大的人工智能编码助手,结合了机器学习技术和编程知识,自动分析代码结构并提供智能建议,支持多种编程语言和环境。
ComfyUI工作流管理插件Comfyspace更新
Comfyspace是一款实用的工作流管理插件,最新更新功能更强大,基本解决了工作流管理和使用的问题。
AI通话服务Bland 半秒响应,可同时进行50万个通话
Bland是一个AI通话服务,它支持半秒响应。它能够稳定地匹配人类的速度和质量,为用户带来最快的沟通体验。
???AI新鲜事
阿里推文生3D数字人项目Make-A-Character
阿里通义实验室XR实验室推出Make-A-Character项目,能从文字快速生成3D数字人。
雷军称小米汽车全身都是先进AI科技
雷军在微博上表示,小米汽车几乎全身都是先进AI科技,V8s也已实现量产,预计2025年上车。
初创公司Nation A发布Neuroid,革新生成式人工智能技术用于3D动画制作
Nation A公司推出Neuroid,一项生成式人工智能技术,可根据文本提示生成人形角色和四条腿的动物的3D动画,显著缩短动画制作时间。
????聚焦开发者
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用
近日,来自得克萨斯农工大学等机构的华人学者们发布了全新的大模型窗口扩展方法SelfExtended(简称SE)。无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!
Colossal-AI团队开源了SwiftInfer
Colossal-AI团队开源了SwiftInfer,实现了无限流式输入推理,成功提升了大模型推理性能46%,为多轮对话场景提供高效可靠的落地方案。