???AI新鲜事
Pika1.0首批用户资格揭晓
Pika Labs最新视频生成产品Pika1.0引起轰动,已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色,提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。
英伟达2023年投资了35家人工智能公司
英伟达在2023年大幅扩大对AI初创企业的投资,已投资35家公司,涵盖范围从大型新人工智能平台到小型初创企业,成为人工智能领域最活跃的投资者之一。
体育画报出版商发生AI丑闻后解雇CEO
著名杂志《体育画报》The Arena Group宣布,其董事会已终止了其首席执行官罗斯·莱文索恩的雇佣关系。
抖音正式上线AI创作功能 最新AI特效破6亿次播放
抖音最新推出AI创作功能,博主通过使用AI生成的漫画特效制作创意视频,受到热烈关注,标志着AI技术在短视频创作领域的广泛应用。
抖音博主用AI生成春晚图 网友辣评:这是过春节还是过鬼节?
抖音知名博主通过AI技术创作了中式春晚图,但在指令发布后图像变幻莫测,引发网友热议,质疑图像中的怪异现象。
Astra Starter Templates 集成 ZipWP AI 网站生成器
Astra Starter Templates 宣布与 ZipWP AI 网站构建器整合,用户可在60秒内创建完整网站,包括内容和图像。
Starter Templates3.5.2:全新基于 AI 的模板工具包库:
https://wpastra.com/changelog/version-3-5-2/
????大模型动态
李飞飞联袂谷歌推出视频生成模型W.A.L.T
谷歌与李飞飞的斯坦福团队联合推出基于Transformer的视频生成模型W.A.L.T,采用因果编码器和窗口注意的变压器架构,在图像和视频领域取得Gen-2水平的逼真效果。
论文地址:https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf
Runway官宣下场通用世界模型
Runway公司宣布发展通用世界模型(GWM),旨在解决AI视频领域的难题。该模型旨在模拟广泛和多样的真实世界情景,提高视频生成系统的理解和逼真度。公司表示将面临许多研究挑战,招募团队应对。
阿里推出东南亚专用AI大语言模型SeaLLM
阿里研究部门发布SeaLLM,首个专为东南亚市场设计的大语言模型,在语言和安全任务上表现优异,突显阿里对该地区增长市场的重视。
Meta AI开源T2V模型AVID 可修复视频改变纹理
Meta AI最近开源的T2V模型AVID具备先进的修复和扩展能力,通过文本编辑视频,支持修复视频、更改对象、改变纹理和颜色,甚至删除或替换视频内容。
项目地址:https://zhang-zx.github.io/AVID/
???AI应用
妙鸭相机推出AI修图
妙鸭相机的新AI修图功能引起关注,通过数字分身和大模型算法实现智能修脸,挑战美图秀秀等传统修图软件在美颜市场的地位。
Google发布编程工具AlphaCode2
谷歌发布了由Gemini模型提升的AlphaCode2,是一款AI编程工具,在编程竞赛中以Python、Java、C++和Go等多语言表现优异,通过复杂技术解决了原AlphaCode的局限。
AI绘图产品Visual Electric图片质量可媲美Adobe Firefly
Visual Electric是一个为创意过程打造的图像生成器,它拥有一个令人惊叹的图像库和相应的提示,可以激发灵感。它可以通过迭代来发展创意,尝试不同的风格和颜色。
体验地址:https://visualelectric.com/
????聚焦开发者
阿里推视频生成框架DreaMovin
DreaMoving是阿里基于扩散模型的视频生成框架,通过图文输入可定制高质量人类舞蹈视频。框架包含Video ControlNet和Content Guider两大组件,实现运动控制和身份保留。通过姿势序列和简单描述,如文本和图像,DreaMoving生成高保真度视频。
项目网址:https://dreamoving.github.io/dreamoving/
UCLA推出Chameleon框架,大模型表格数学推理准确率达98.78%
由UCLA等机构推出的Chameleon框架通过多工具融合,包括LLMs、视觉模型、搜索引擎等,解决大型语言模型在实时信息获取和数学推理上的不足,在表格数学推理任务上达到98.78%准确率。
项目地址:https://chameleon-llm.github.io/