-
OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
【新智元导读】OpenAI被曝出了新项目「草莓」,据悉能提前计划,自主浏览网页,还能进行深度研究。草莓由大量通用数据上后训练而成,推理能力显著提高。根据OpenAI最近的AGI路线图,草莓疑似已达Level2。 昨天刚刚被曝出AGI五级路线图,今天Open...
-
规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果...
鱼羊 明敏 发自 凹非寺量子位 | 公众号 QbitAI 本周国内最受关注的AI盛事,今日启幕。 活动规格之高,没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流,李开复与...
-
Sora AIGC 介绍
Sora的概念介绍: 近年来,AI、大模型相关领域的发展可谓是一天一个脚印,一步一个台阶。从语音识别文字开始,再到chatgpt3、chatgpt4文字互动工具,以及midjourney等AI成图工具,再到现在的vison pro等VR交互设备和今天我们...
-
【AIGC半月报】AIGC大模型启元:2024.06(下)
AIGC大模型启元:2024.06(下) (1 Gen-3 (2 Open-Sora 1.2(Open-Sora再升级) (3 Claude 3.5 Sonnet(Claude升级) (4 ChatTTS v3(ChatTTS升级) (...
-
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来
刚刚过去的2024年3月,OpenAI最强人工智能(AI)大模型GPT-4发布了一周年,对于生成式 AI 的热度只增不减。 过去一个月内,OpenAI、谷歌、微软、英伟达、阿里等多家国内外大科技公司均发布多个关于 AI 的重要消息,动作不断,全球最强...
-
70万人争先体验!视频生成新王者「可灵AI」又双叒升级了
难不成,AI 生成短剧时代真的要来了? 最近,各路视频生成 AI 放出的 Demo 让人眼花缭乱。从玩梗图、拼长度再到讲究真实物理逻辑,层出不穷的人工智能创意难分高下,个个都要跟 Sora 试比高。这时候,突然有人偷偷先行一步,搞出了「电影级」的表现: 从...
-
达摩院发布一站式AI视频创作平台“寻光”,打造全新AI工作流
今年是 AI 视频生成爆发的元年,以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于 AI 的视频创作方式开始流行起来。 但新技术也引发更多的挑战与质疑,除了大家熟知的 “开盲盒”现象,AI 所生成的视...
-
AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题
AIGC时代,视频创作这事儿真的不一样了。 就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~ 想要调整一下镜头角度,交给AI,同样能一键完成: 还能一键消除、修改目标: 后期再也不用加班加到手抽筋(d...
-
5分钟教你用AI把老照片动起来,别再去花49块9的冤枉钱了
最近,AI视频在各大平台上,又火了。 只是火的形式,变成了将老照片动起来,打情感牌,或者做很多经典电视剧的再整活。 直接把可灵的生成时间,从以前的4分钟,生生的干成了20分钟。 火的原因,一方面是因为快手可灵的图生视频正式上线,给大家提供了一个工具的基...
-
AI日报:Runway的Gen-3 Alpha正式开放使用;百度文心大模型4.0 Turbo限时免费;英伟达发布直播神器;爆火Character AI惨遭阉割
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Runway的Gen-3 Al...
-
如何玩转云端文生视频、0码构建AI应用?华为云专家来揭秘
本文分享自华为云社区《HDC 2024丨华为云开发者社区直播精华回顾》,作者:华为云社区精选。 6月21-23日,备受瞩目的华为云开发者大会2024为广大开发者奉上HarmonyOS、盘古大模型、昇腾AI云服务、GaussDB数据库等最新创新成果。华为云...
-
Llama模型家族之RLAIF 基于 AI 反馈的强化学习(三) RLAIF 的工作原理
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
技术周刊 116 期:Visual Copilot、INP、Kimi 支持 200 万字上下文、Grok 开源、Figure 01、Open Sora 开源
美味值:????? 口味:话梅排骨 食堂技术周刊仓库地址:https://github.com/Geekhyt/weekly 大家好,我是童欧巴。欢迎来到前端食堂技术周刊,我们先来看下上周的技术资讯。 技术资讯 前端 Builder.io...
-
2024年AIGC行业研究:多模态大模型与商业应用_
2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...
-
Llama模型家族之拒绝抽样(Rejection Sampling)(二)均匀分布简介
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
Llama模型家族训练奖励模型Reward Model技术及代码实战(二)从用户反馈构建比较数据集
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
Llama模型家族之RLAIF 基于 AI 反馈的强化学习(一)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
Llama模型家族之Stanford NLP ReFT源代码探索 (一)数据预干预
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
跟AI做搭子,还是这届年轻人会玩儿
这届年轻人越来越喜欢跟AI做搭子。 比如跟AI做生活搭子,让它帮自己挑水果,X平台网友“Cydiar”前不久发文,说自己用GPT-4o选出了水果店里薄皮沙瓤的一个甜西瓜。 对此,有超70万网友在线围观,还有不少人在评论区用AI选起了各种水果。 除了让...
-
AI日报:Hedra图转说话视频免费开放;Deepmind发布超牛自动视频配音技术V2A;美图WHEE V2正式上线;开源版Sora可一键生成720p高清视频
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Hedra的 Characte...
-
AI视频进入有声时代!谷歌发布视频生成音频技术,效果丝滑惊艳网友!
Runway前脚刚发布Gen-3Alpha,Google后脚就跟了个王炸。 北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐,逼真的音效,甚至是人物...
-
Runway正式发布全新Gen3模型,AI视频的王,它回来了。
在AI视频被一众新秀,比如Sora、Luma、可灵等等占据注意力的时候,已经有人忘了AI视频领域统治了N久的王者,他叫Runway。 去年的11月份更新了一次Gen2模型模型,然后宣布他们要开始组团队开始进军世界模型之后。 他们就再无动静了。 一晃眼,将...
-
免费体验一个月微软Copilot Pro!在Office套件里使用GPT-4!
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效...
-
Llama模型家族之Stanford NLP ReFT源代码探索 (三)reft_model.py代码解析
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
AI视频新霸主诞生!Dream Machine官宣免费用,电影级大片全网玩疯
【新智元导读】继Pika宣布上新2.0版本后,视频生成领域又有新模型加入。成立于2021年的Luma AI今天刚刚官宣了文生视频/图生视频模型Dream Machine,而且提供免费使用API,高质量的生成效果获得了很多网友的好评。 视频生成领域,又添一员...
-
超5万人排队内测!海内外爆火的“中国版Sora”惊艳全场,真这么好用?| AI评测
谁能想到,现在外网最抢手的AI视频生成模型,不是Sora,也不是Runway或Pika,而是国产大模型“Kling(可灵)”。 可灵视频合集在X平台上获得数百万浏览量 由于生成视频效果惊艳,可灵在国外获得了“中国版Sora”“Sora杀手”等称号。 除了...
-
基于Ascend C的FlashAttention算子性能优化最佳实践
本文分享自华为云社区《基于Ascend C的FlashAttention算子性能优化最佳实践》,作者:昇腾CANN。 LLM的Attention部分处理给计算系统带来巨大的计算和访存压力。业界先后出现FlashAttention、FlashAttenti...
-
AI日报:Luma AI文生视频模型炸裂程度堪比Sora;Stable diffusion 3 正式开源;Suno正式发布音频输入功能;阿里发布超级“融图”工具MimicBrush
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Luma AI推重磅级文生视频...
-
Lumal AI文生视频模型Dream Machine使用教程(附Lum AI官网入口)
知名的3D建模平台Luma AI推出了个相当惊艳的文生视频模型Dream Machine,不仅操作简单,其效果堪比Sora。只要输入关键词就能生成 5 秒高质量的视频,具有出色的动作连贯性和视觉效果。本文将为大家...
-
我们最近跟刚融了8000万美元的Pika聊了聊,它有点儿想成为 AI 版的 TikTok
6月5日,AI 视频生成工具 Pika 宣布了它新近完成的8000万美元 B 轮融资。领投方是风险投资机构 Spark Capital,参与本轮投资的还有 Greycroft 、光速创投(Lightspeed Venture Partners)、Neo、M...
-
免费开放!Lumalabs AI推出Dream Machine文生视频模型
6月13日,3D建模平台Luma AI推出了一款名为Dream Machine的新型文生视频模型,并向所有用户免费开放。Dream Machine不仅支持文本生成视频,还能利用图片作为引导来创造视频内容。其生成的视频在质量、动作一致性、色彩、光影、饱和度和...
-
国产Sora来了!清华发布视频生成大模型“视界一粟YiSu”
快科技6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型视界一粟 YiSu”。 该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、...
-
2024年AIGC行业研究:多模态大模型与商业应用
2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...
-
Llama模型家族训练奖励模型Reward Model技术及代码实战(三) 使用 TRL 训练奖励模型
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
Llama模型家族之使用 Supervised Fine-Tuning(SFT)微调预训练Llama 3 语言模型(十) 使用 LoRA 微调常见问题答疑
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
企业版ChatGPT用户激增至60万;百度文心一言推出个性化声音定制功能
? AI新闻 ? 企业版ChatGPT用户激增至60万 摘要:OpenAI首席运营官Brad Lightcap在接受采访时透露,企业版ChatGPT的注册用户已超60万,相较2024年1月的15万用户,短短三个月内增长了300%。这一版本自2023...
-
Llama模型家族之使用 Supervised Fine-Tuning(SFT)微调预训练Llama 3 语言模型(一) LLaMA-Factory简介
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
AI日报:快手版Sora可灵开放测试;阿里悄悄开源Qwen2系列模型;Grok 1.5V或将接入Midjourney;柯南动画风AI特效刷屏抖音
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、媲美Sora?快手文生视频模型...
-
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (四)
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (四) 大家继续看 https://lilianweng.github.io/posts/2023-06-23-agent/的文档内容 第三部分:工具使用 工具的使用是人类...
-
实测完快手的AI视频「可灵」后,我觉得这才是第一个中国版Sora
昨天,6月6号,是快手的13周年生日。 在这一天,所有AI圈的人都想不到,快手在13周年之际,没有任何预兆、没有任何宣传,直接发布了他们的AI视频大模型。 可灵。 给我也干了个措手不及。 我当时正在看360的发布会,突然手机就叮叮当当一顿狂响,打开一看,...
-
Llama模型家族训练奖励模型Reward Model技术及代码实战(一)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
AI视频生成工具Pika Labs获8000万美元融资 估值4.7亿美元
AI 视频生成器 Pika Labs 近日宣布获得了8000万美元的融资。这家初创公司的估值在这轮融资后达到了4.7亿美元,虽然仍远远落后于 Runway 的15亿美元估值,但也是一笔不小的金额。Pika Labs 的团队由来自 Google、Meta 和...
-
无需搭建环境,零门槛带你体验Open-Sora文生视频应用
案例体验 ?* 本案例需使用 Pytorch-2.0.1 GPU-V100 及以上规格运行 ?* 点击Run in ModelArts,将会进入到ModelArts CodeLab中,这时需要你登录华为云账号,如果没有账号,则需要...
-
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
什么?疯狂动物城被国产AI搬进现实了? 与视频一同曝光的,是一款名为「可灵」全新国产视频生成大模型。 它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。 数据上看...
-
快手发布视频生成大模型「可灵」:已开放邀测 效果对标Sora
近日,快手发布了一款名为「可灵」的视频生成大模型,该模型效果对标了之前发布的 Sora,同时已在快手旗下的快影 App 开放邀测体验。 可灵大模型具有多项优势,包括能够生成大幅度的合理运动、模拟物理世界特性、具备强大的概念组合能力和想象力,以及支持高分辨率...
-
别再说国产大模型技术突破要靠 Llama 3 开源了
近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。 Meta 表示,Llama 3 已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型...
-
【AIGC半月报】AIGC大模型启元:2024.05(下)
AIGC大模型启元:2024.05(下) (1 豆包大模型(抖音大模型) (2 Project Astra(谷歌对标GPT-4o) (3 Chameleon(meta对标GPT-4o) (4 MiniCPM-Llama3-V 2.5(面...
-
【AI绘画】Stable Diffusion魔法修习—“画风“自由切换(stable diffusion模型下载与使用技巧)
stable diffusion模型文件指AI学习了大量指定风格图片后,存储了这些学习信息的文件,可以用来绘制特定风格的图片。 大模型chickpoint(检查点 :可以理解为保存指定节点的模型文件。训练模型特别耗算力,保存到指定节点之后,可以方便下次继...
-
【AIGC调研系列】XTuner、Unsloth方案对比
XTuner和Unsloth都是用于大型语言模型(LLM)训练和微调的工具,但它们在设计理念、技术实现和性能表现上存在一些差异。 技术架构与支持的模型规模: XTuner支持千亿级参数的模型,并能够处理超过百万个tokens的序列。它通过序列...
-
AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型 轻松文生视频
AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型 ?轻松文生视频 学习前言 源码下载地址 技术原理储备(DIT/Lora/Motion Module) 什么是Diffusion Transformer (DiT ...