当前位置:AIGC资讯 > AIGC > 正文

AI日报:Llama3.1重磅上线;可灵上线国际版1.0并开启付费计划;腾讯PhotoMaker V2升级

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、最强开源模型来了!Llama3.1以405B参数领先GPT-4o

在人工智能的世界里,开源与闭源的较量从未停歇。Meta AI的Llama3.1模型的发布标志着开源AI走向成熟,预示着一个全新的时代即将到来。Llama3.1表现超越闭源模型,在性能上与闭源模型并驾齐驱,开启了开源AI可能成为行业标准的新时代。

2、可灵AI视频开启付费计划 结束免费生成体验

可灵宣布结束免费生成体验,推出多层次付费会员计划,为用户提供更多样化的服务选择。新会员体系包括非会员、黄金会员、铂金会员和钻石会员,享受限时五折优惠。可灵定价亲民,性价比高,满足不同用户需求。转变商业模式展现成熟,将在AI视频生成领域发挥重要作用。

3、快手AI视频产品可灵国际版1.0上线

快手今日宣布,其AI视频产品可灵国际版1.0正式上线,用户无需中国手机号码,每日登录可获得66个免费积分,引发全球热烈反响。可灵迅速崛起,改变AI视频格局,被视为国产AI模型向国际市场进军的重要一步。付费用户体验提升,定价合理,保持竞争力。

4、AI视频编辑神器Vozo 可使用提示重写脚本并重新配音

Vozo是一款颠覆性的视频编辑工具,利用人工智能技术彻底改变了内容创作方式。它通过智能视频重写与重配音、文本驱动的语音编辑、多角色口型同步等功能,为用户提供了前所未有的视频编辑和改编能力。同时,Vozo支持专业视频翻译和自动视频优化,极大地简化了内容的国际化过程。

5、PixVerse V2视频模型发布 支持直接生成8秒视频

PixVerse发布了V2版本的视频模型,可以直接生成长达8秒的视频,提升了画质和细节。这款工具让用户的创意无限,细节控制精准,连贯性强,场景丰富。操作简单,满足各种风格需求,让用户在8秒内创造一个世界。

6、腾讯PhotoMaker V2升级 几秒钟完成个性人物图像定制 无需训练LoRA

腾讯近日发布了PhotoMaker V2版本,革命性提升AI个性化人物图像定制效率和质量。通过ID嵌入技术,实现快速高质量个性化图像生成,无需繁琐训练过程。提升图像ID真实度,增强用户生成控制能力,效率提升近4倍。开启个人用户和专业创作者新可能性,简化个性化图像内容创作过程。AI技术进步将改变创意产业,催生新艺术表现形式和商业模式。

7、北大出品新3D场景生成框架HoloDreamer

HoloDreamer是一款新型的3D场景生成框架,通过用户的文本描述生成身临其境、完整的3D场景。这一创新性进展将推动文本驱动的3D场景生成研究,为虚拟现实、游戏和影视行业提供新的解决方案。

8、Adobe为Illustrator和Photoshop引入更多生成式AI功能

Adobe最近推出了新一轮的生成式AI功能,旨在提升设计软件Illustrator和Photoshop的创作流程效率。这些更新包括Illustrator的生成式形状填充工具和Photoshop的图像生成功能,为设计师提供更多创作自由和便利。尽管引发了部分创意专业人士的担忧,Adobe强调生成式AI的目的是增强创意表达而非取代人类创意。这一系列更新是Adobe自去年推出Firefly模型以来的最新成果,希望为创意行业带来更多创新机会。

9、快手:添加AIGC内容“作者声明”不会影响作品流量

快手平台推出了新功能“作者声明”,鼓励创作者在发布AI生成内容时添加声明,以减少误解。创作者需遵循操作引导手册,可通过作者声明标注AI生成内容。添加声明不影响作品流量,除非违反法律或规则。更新快手app至最新版本可解决标识操作入口问题。快手希望与创作者合作,共同打造真实有趣社区环境。

10、快手可灵团队开源项目LivePortrait爆火 一张照片生成动态视频 大叔秒变少女!

快手可灵团队开源的人像视频生成框架LivePortrait在人工智能领域引起轰动,展现了AI技术在视频生成领域的巨大潜力。该项目在GitHub上已获得7.5K星标,成为当下最热门的AI项目之一。LivePortrait不仅能让静态图像动起来,还能精确复制表情到不同人身上,具有广泛的应用价值。

11、百川智能联合天津大学推出“Sibyl System”Agent框架 登顶大模型复杂任务榜单GAIA

百川智能与天津大学合作推出的Sibyl System智能体框架在GAIA Leader Board上取得第一名成绩,突显其在复杂任务执行方面的卓越能力。GAIA评测方案揭示了现有模型的能力缺陷,为模型研发提供改进方向,要求AI具备推理、多模态理解、网页浏览和使用工具等能力。Sibyl System框架设计特点包括类人的浏览器界面替代检索、问答替代对话、引入“陪审团”机制等,实现了模型从“快思考”到“慢思考”的转变。

12、微软VALLE-2模型实现零样本文本到语音技术

微软发布的VALLE-2模型实现了与人类同等水平的语音合成,被认为是TTS领域的里程碑式进展。该模型展现了惊人的即时模仿能力,提高了解码稳定性,加速了推理过程,简化了数据需求,超越了前代模型VALLE,引发了关于技术伦理和责任使用的深度思考。

13、LazyLLM: 提高LLM长文本推理效率

LazyLLM是一项由苹果公司和Meta AI联合推出的新技术,旨在提高大型语言模型在长文本推理中的效率。该技术通过动态选择重要token来加速LLM推理过程,在长文本场景中表现突出。LazyLLM不需要对现有模型进行改动,易于实施,同时能显著提高推理速度,保持较高的准确性。

14、谷歌二季度收入达850亿美元,AI与搜索业务助力增长

谷歌在第二季度取得了令人瞩目的成绩,收入达到850亿美元。其搜索业务和云计算部门表现突出,AI技术的应用也取得了显著进展。此外,谷歌放弃了逐步淘汰第三方Cookie的计划,转而推行用户知情选择政策。整体业务增长势头良好,展望未来发展潜力巨大。

总结

### 【AI日报】综述
**【AI日报】**专栏如期而至,汇聚了AI领域的最新动态与创新发展。从开源模型的里程碑进步,到AI视频生成与编辑的革命,再到个性化图像定制的提升,本次报告带你领略AI技术带来的无尽魅力与可能性。
**一、开源模型突破**
- **Llama3.1** 以沉甸甸的405B参数量轻松超越GPT-4o等闭源模型,开启了开源AI走向行业标准的新纪元。
**二、AI视频质的飞跃**
- **可灵** 视频付费会员计划上线,全球用户反响热烈;**快手可灵国际版** 则为用户提供66个免费积分,进一步打破AI视频格局。
- **Vozo** 和 **PixVerse V2** 带来先进的视频编辑和生成功能,分别实现视频剧本重写与高质量8秒视频制作。
- **LivePortrait** 将静态图像转换为动态视频,见证了AI在图像生成领域的巨大潜力。
**三、个性化图像新篇章**
- **腾讯PhotoMaker V2** 通过ID嵌入技术,实现快速、高质量的个性化人物图像定制,为创意产业注入新活力。
**四、新技术与新工具**
- **HoloDreamer** 提供文本驱动的3D场景生成,打开虚拟现实和游戏行业的新局面;而**Sibyl System** 智能体框架则在复杂任务中表现出色,荣登榜首。
- **Adobe的更新** 将更多生成式AI功能引入设计软件,旨在提升创意和专业人士的工作效率。
**五、企业动态及市场动态**
- **微软VALLE-2模型** 展现了与人类媲美的语音合成技术,标志着语音识别与语音合成技术的又一次飞跃。
- **LazyLLM技术** 提升LLM模型在长文本推理中的效率,应对愈发复杂的处理需求。
- **谷歌财报** 显示,强大搜索业务和云计算以及AI技术进步,推动收入显著增长至850亿美元。
以上仅为AI领域的冰山一角,但这片汹涌澎湃的海域中,无不隐藏着潜力和机遇。让我们一起拭目以待,AI的未来将以怎样的面貌呈现在我们眼前。

更新时间 2024-07-24