???AI应用
Stability.ai发布开源文生图模型SDXL Turbo
文生成图AI平台Stability.ai发布开源SDXL Turbo,图像生成实时响应,仅需1秒。SDXL Turbo基于全新对抗扩散蒸馏技术(ADD),将生成步骤减至1-4步,保持高质量。性能测试显示,SDXL Turbo在1步骤击败LCM-XL的4步骤和SDXL的50步骤。虽有局限,只能用于学术研究,生成512x512固定像素图片,但技术突破可助中小企业低成本应用。
开源地址:https://github.com/Stability-AI/generative-models
在线体验地址:https://clipdrop.co/stable-diffusion-turbo
论文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdf
Pika Labs1.0版发布
AI初创公司Pika Labs正式发布了其令人印象深刻的AI视频生成器的1.0版本,为视频创作带来了全新的体验。
Pika Labs体验网址:https://top.aibase.com/tool/pika-labs
字节跳动ChitChop在海外上线
字节跳动推出的大模型产品“ChitChop”在海外上线,由POLIGON开发和运营,提供多达200+的智能机器人服务,支持创作、工作、AI画画、娱乐、AI学习和生活等六大场景,具备语音输入和文件分析功能。
???AI新鲜事
OpenAI介入调查:GPT-4在编写代码上偷懒
GPT-4最新版本因偷懒不愿编写完整代码,用户抱怨频出,引起广泛关注和调查。
法院判决AI生成图片具备版权
北京互联网法院首次就AI生成图片领域著作权侵权案作出一审判决,认定AI生成的图片具备独创性和智力投入,应受著作权法保护,为该领域著作权保护树立了重要判例。
vivo S18系列将首批搭载蓝心AI大模型
vivo宣布S18系列将成为首批采用AI大模型技术的手机,搭载自研蓝心大模型,参数量级涵盖十亿、百亿、千亿。S18将采用骁龙7Gen3处理器,而S18Pro升级为天玑9200处理器。
谷歌搜索展示AI生成图片替代了真实照片
最新报道指出,谷歌搜索结果中以色列传奇歌手卡玛卡维沃·奥莱的照片实际上是由人工智能生成的,引发了对搜索准确性的担忧。
亚马逊宣布推出新的人工智能芯片Trainium2
亚马逊AWS推出新的人工智能芯片「Trainium2」,旨在构建和运行AI应用程序,同时深化与英伟达的合作,提供对Nvidia最新芯片的访问。
一男子用AI工具洗稿竞争对手文章 “窃取”数百万的页面浏览量
人工智能生成工具在SEO领域引发争议,Content Growth创始人通过AI文本生成器成功窃取360万流量,引发用户质疑和道德担忧。
麻省理工学院推GenSim项目:利用大语言模型编写机器人新任务
麻省理工学院的“GenSim”项目利用大型语言模型如GPT-4,通过自动生成新任务或详细说明所需行为的每个步骤,扩大了机器人可以接受培训的仿真任务范围,为机器人学习提供更广泛的模拟任务。
亚马逊推出AI聊天机器人Amazon Q
亚马逊在re:Invent大会上发布了面向AWS客户的AI聊天机器人「Amazon Q」,可提供广泛的解决方案和操作建议,涵盖业务智能、编程和配置等多个领域。
????大模型动态
北大提出Chat-UniVi视觉语言大模型
Chat-UniVi是由北大和中山大学研究者提出的统一视觉语言大模型,在短短三天训练内获得130亿参数,通过动态视觉token和密度峰聚类算法实现统一视觉表征,在多任务中表现卓越。
项目地址:https://github.com/PKU-YuanGroup/Chat-UniVi
新加坡国立大学开源多模态语言模型 NExT-GPT
新加坡国立大学发布的开源多模态语言模型 NExT-GPT,通过处理文本、图像、视频和音频等多样化输入,推动了多媒体人工智能应用的发展,为开发者提供强大支持。
研究人员发布Starling-7B:基于AI反馈的大语言模型
UC伯克利发布基于AI反馈强化学习的Starling-7B大语言模型,采用RLAIF技术,在性能上媲美GPT-3.5,通过基准测试表现出色,迈向更人性化的应用。
项目网址:https://huggingface.co/berkeley-nest/Starling-LM-7B-alpha
????聚焦开发者
Keras3.0正式发布
Keras3.0发布,全面支持TensorFlow、JAX和PyTorch,进行了全新的大模型训练和部署功能引入,保持高度向后兼容性,为深度学习开发者提供更多选择和工具。
中国团队开源大规模高质量图文数据集ShareGPT4V
中国团队开源了基于GPT4-Vision构建的图文数据集ShareGPT4V,训练了7B模型,涵盖120万条多样性丰富的图像-文本描述数据,在多模态性能上超越同级别模型,为多模态研究和应用提供了新的基石。
上海AI实验室、Meta联合开发开源模型 可为人体生成3D空间音频
上海AI实验室与Meta合作推出的开源模型利用头戴式麦克风和人体姿态信息,成功生成人体的3D空间音频,为虚拟环境提供关键支持。
项目地址:https://github.com/facebookresearch/SoundingBodies
Real-ESRGAN-Video:将视频清晰度提升至2K或4K
Real-ESRGAN-Video技术让用户轻松将视频清晰度提升至2K或4K,通过简化上传和选择清晰度的步骤,提供多种模型处理模式,特别适用于动画视频。测试结果显示对相对清晰的视频效果显著,为提升视频素材清晰度带来新可能。