-
Llama 3 模型家族构建安全可信赖企业级AI应用之 CyberSecEval 2:量化 LLM 安全和能力的基准(一)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
AI绘画,AI绘画大模型资料汇总,常见几个网站,搜不到答案用Edge,微软的搜索一下有时能找到解决问题的答案
第一个模型:中国镜像AI绘画模型 We'll be right back | Civitai 资料链接: Civitai中国镜像AI模型免费网站——只为造福不会魔法的炼丹师,还有五个免费模型网址整合介绍-喜好儿网 (heehel.com 第二...
-
Sora将亮相 “翠贝卡电影节”,展示5位导演的AI电影作品
划重点: ⭐️ Sora 将在翠贝卡电影节展示5部由 AI 制作的微电影 ⭐️5位知名导演通过 Sora 制作影片,引发关注和讨论 ⭐️ AI 技术或将颠覆影视行业的影视制作流程 近日,OpenAI 的文生视频模型 Sora 将在即将举办的 “翠贝卡电影节...
-
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)
基于LlaMA 3 + LangGraph 在windows本地部署大模型 (一) RAG 是未来人工智能应用的基石。大家并不是在寻求仅仅产生无意义反应的人工智能。而目标是人工智能能够从特定文档集中检索答案,理解查询的上下文,指导自己搜索其嵌入内容...
-
缓解字节 AI 焦虑的超级应用:剪映 or 豆包?
张一鸣把抖音最重要的两个人物,都放在AI相关的核心位置。 今年2月,OpenAI发布视频生成模型Sora过去9天后,张楠放下抖音CEO的位置,聚焦剪映。看上去这是一个舍大取小的举动,甚至有被流放之嫌。事实是,和陈林当初负责教育业务一样,张楠在为字节攻克新高...
-
OpenAI与《大西洋月刊》和The Verge发行商Vox Media达成合作
人工智能公司 OpenAI 近日宣布与美国杂志《大西洋月刊》和数字媒体公司 Vox Media 达成合作协议。根据协议,OpenAI 将获得许可使用两家公司的内容,用于训练其大型语言模型(LLMs)和多媒体 AI 模型(如 GPT-4o,Sora 。 图...
-
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) #Options local_llm = 'llama3' llm = ChatOllama(model=local_llm, format="json", tempe...
-
国产开源Sora上新:全面支持国产AI算力,可用ReVideo视频编辑,北大-兔展团队出品
北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan,今起可以生成最长约21秒的视频了! 生成的视频水平,如下展示。先看这个长一点的,9.2s: 当然了,老规矩,这一次的所有数据、代码和模型,继续开源。 目前,Open-Sora-Plan在...
-
Llama 3 模型家族构建安全可信赖企业级AI应用之使用 Llama Guard 保护大模型对话 (八)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
智影AI轻松制作故事转视频AI创作神器!快速开启AI绘画小说推文之旅
文章目录 1.前言 1.1 生成内容形式 1.2 小说推文说明 2.产品介绍 2.1 产品说明 2.2 功能说明 3.推文视频制作 3.1 新建小说 3.2 新建作品 3.3 拆分文案 3.4 角色/场景创建 3.5 分镜管理...
-
关于AIGC发展历程的研究报告(原创文章)
摘要: 2022年,Chat GPT和Stable Diffusion展现了AIGC强大的技术实力,拉开了AIGC时代的帷幕。2023年,GPT-4、Midjourney V5等又掀起了人工智能的热潮,2024年2月15日(美国当地时间)正...
-
惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发
这几天,在巴黎举办的最大科技活动VivaTech上,OpenAI再次带来了许多惊喜。 从展示的模型智能进化路线图中,可以确定的是,今年OpenAI一定会发布新一代旗舰模型。 而且,大概率不会以GPT-5命名,演示中将其称之为「GPT Next」。 那么...
-
桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o demo再次惊艳:“能力还是被低估了”
GPT-4o桌面端最新Demo,与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。 现场,OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。 在视频聊天当中,即使给它的只有一幅抽象的简笔画,它也能立马...
-
OpenAI陷史上最大危机!奥特曼否认霸王条款急推背锅侠,网友:他撒谎成性
OpenAI的宫斗后续,还没完。 之前的说法是,未签署离职文件的前员工,会面临失去股权的风险。 就在刚刚,外媒Vox曝出,OpenAI领导层表示,自己完全不知道这回事啊! 然而,OpenAI的相关文件上,却赫然出现了他们的签名。 图片 深入调查下去,整件...
-
通用世界模型问世:不学习就能生成新领域视频,可实时控制
随着 OpenAI 今年 2 月发布 Sora,世界模型(World Model)再次成为了 AI 领域的热门。 世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,一直以来被认为是通往通用人工智能(AGI)的关键路径之一,与当前大模型推崇的智能...
-
GPT-4o团队引发OpenAI组织创新热议,应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天: 领衔者,是DALL·E2/3研究团队成员、Scaling Law共同提出者。 更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。 这里的“新人”,可能是本科or硕博刚毕...
-
GPT-4o团队引发OpenAI组织创新热议!应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天: 领衔者,是DALL·E2/3研究团队成员、Scaling Law共同提出者。 更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。 这里的“新人”,可能是本科or硕博刚毕...
-
GPT-4o预告中的语音助手“Her”真的很惊艳,但问题是我们还有多久才能够真正上手?网友:PR鬼才奥特曼都坐不住了
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI 发布会中的GPT-4o给所有人都看眼馋了! 谁不想第一时间体验下传说中的“Her”呢? 图片 在发布会上,GPT-4o展示了自己的“magic”:高超的语音理...
-
首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用
中文 AI 社区迎来了一个好消息:与 Sora 同架构的开源文生图大模型来了! 5 月 14 日,腾讯宣布旗下混元文生图大模型全面升级并全面开源,目前已在 Hugging Face 平台及 GitHub 上发布,包含模型权重、推理代码、模型算法等完整模型...
-
两小时“吼出”121次AI,谷歌背后埋伏着Open AI的幽灵
谷歌和Open AI的又一次对阵,刚刚落幕了。 北京时间5月14日凌晨,OpenAI发布端到端多模态AI大模型GPT-4o,酷似科幻电影《Her》的AI语音对话迅速成为关注焦点。 24小时后,携新版Gemini AI大模型等产品,谷歌在北京时间5月15日凌...
-
谷歌Gemini对OpenAI贴脸开大!文生视频模型Veo硬刚Sora
谷歌近日发布了一系列强大的AI工具,展开了一场针对OpenAI的激烈竞争。这一波强势反击包括了Project Astra、Veo视频模型以及Gemini1.5Pro等一连串武器,旨在彻底颠覆谷歌搜索,并对OpenAI展开全面挑战。 其中,谷歌发布的视频模型...
-
谷歌硬刚GPT-4o!60秒视频生成模型虽迟但到,上下文窗口达200万
OpenAI出手再次惊艳世界,谷歌果然坐不住了。 GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场。 同样能会还有,不仅能几乎没有延迟地和人类流畅交流,通过摄像头,这个名为P...
-
腾讯宣布混元文生图大模型开源: Sora 同架构,可免费商用
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。 这是业内首个中文原生的 DiT 架构文生图开源模型...
-
重磅!腾讯宣布混元文生图大模型开源: Sora 同架构,中英文原生DiT,可免费商用
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。 这是业内首个中文原生的DiT架构文生图开源模型,支...
-
被追问Sora是否使用YouTube数据,OpenAI高管又语塞了
OpenAI 的另一位高管在被问及 Sora 视频生成器是否使用了 YouTube 数据时,同样陷入了困境。在最近举行的 Bloomberg 科技峰会上,OpenAI 席运营官 Brad Lightcap 在回答记者 Shirin Ghaffary 的问题...
-
OpenAI春季发布会:这是“Moss”的诞生,我们人类究竟该何去何从
今天,OpenAI又又又又开发布会了。 在大众心里,现在也基本上都知道,奥特曼是一个贼能PR的人。 每一次的PR的时间点,都拿捏的极其到位,精准的狙击其他厂商。比如说上一次Sora,其实你会发现从头到尾就是一个PR的举动,2月16号发的,特么的快3个月了,...
-
腾讯和字节的幽灵在中国AI的上空徘徊
2023 年 4 月,产品经理松鹅(化名)从腾讯离职两天后,就从深圳来到北京,加入一家基座大模型的初创公司。彼时,这家公司还没什么资本追捧和用户声量,只有一个听起来挺拗口的中文名字:月之暗面。 那时候这家公司的产品团队,只有松鹅一个人。 同月,曾经在字节跳...
-
扩散模型与文生视频
一、快速发展的文生视频 在当前的人工智能领域,文生视频技术有着引人注目的进展。该技术的核心任务非常明确,就是利用文本指令来控制视频内容的生成。具体而言,用户可以输入特定文本,系统则根据这段文本生成相应的视觉画面。这一过程并不局限于单一的输出,相同的文本可...
-
文生音乐来了!“Suno AI音乐”上线,小狐狸AI同步开团直降1500!
随着Suno AI的迅速崛起,其AI生成音乐功能也取得了显著的突破。如今,用户只需在Suno上输入一句话作为提示,即可得到一首包含完整作词、作曲、演奏和人声演唱的精美歌曲。这一创新极大地降低了音乐创作的门槛,让普通人也能轻松涉足音乐创作的世界。 特别是随着...
-
AlphaFold 3一夜预测地球所有生物分子,谷歌DeepMind颠覆生物学登Nature头版!
时隔3年,AlphaFold 3横空出世,再次掀起AI学术圈巨震! 初代AlphaFold诞生之后,一直停留在预测「蛋白质」的宇宙中。 今天,升级后的AlphaFold 3能够以前所未有的「原子精度」,预测出所有生物分子的结构和相互作用。 图片 最重要的...
-
智谱AI研发国产文生视频模型对标Sora 最快年内发布
据钛媒体报道,智谱 AI 正在研发对标 OpenAI Sora 的高质量文生视频模型,预计最快年内发布。 该公司是国内一家估值过200亿的 AI 大模型独角兽公司,成立于2019年,由清华大学计算机系的技术成转化而来。智谱 AI 已推出多个大模型产品,包括...
-
OpenAI Sora让创作者们工作轻松,他们还相信自己不会轻易被取代
5月6日消息,OpenAI文生视频工具Sora的早期测试者们似乎可以松口气了。他们并没有因为这款工具而出现即将被取代的恐慌,反而觉得它让他们的工作变得更加游刃有余。 今年2月,人工智能初创公司OpenAI正式推出了Sora,这款工具旨在“深入理解和模拟...
-
苹果新产品明晚10点发布;曝iPhone 17 Slim新机型;昆仑万维净亏损1.87亿元;智谱AI正研发类“Sora”产品
出品 | 51CTO技术栈(微信号:blog51cto)一、商业圈 1.“AI教母”李飞飞首次创业,瞄准空间智能 李飞飞,著名华裔计算机科学家,因其在人工智能领域的卓越贡献而被誉为“AI教母”。根据国外媒体消息,李飞飞正在致力于她的首次创业——一家名为...
-
强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?
1视频生成模型“新王登基”,Sora 何以成为全球焦点? 2023年以来,多模态视频生成技术取得了显著的进展和突破,从 Runway 到 Pika 再到年末的 VideoPoet,视频生成模型进入到加速阶段。2024年2月,OpenAI 旗下视频生成模型...
-
“地表最强”文生视频模型?Sora 背后有何秘密?
自 2022 年底 ChatGPT 的横空出世,人工智能再度成为全世界的焦点,基于大语言模型(LLM)的 AI 更是人工智能领域的“当红炸子鸡”。此后的一年,我们见证了 AI 在文生文、文生图领域的飞速进展,但在文生视频领域发展相对较慢。而在 2024 年...
-
AI日报:Awaker 1.0写真视频击败Sora?Sora视频被指大量后期;苹果首款AI平板曝光;百万网友围观博主和AI“谈恋爱”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、写真视频击败Sora?人大自研...
-
Sora爆火短频“气球人”制作者亲述优缺点:视频其实都是专业制作,Sora占一小部分;一致性不能很好控制;似有识别版权问题的机制
整理 | 言征 OpenAI 的视频生成工具 Sora在2月份让业界大吃一惊,其流畅、逼真的视频似乎远远领先于竞争对手。然而这场精心策划的首次亮相,留给了大众太多不为人知的细节。 近日, OpenAI 大火的宣传短片的制作团队之一的Shy Kids...
-
写真视频击败Sora?人大自研全新多模态大模型Awaker 1.0震撼登场
在人工智能领域,人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型,标志着向通用人工智能(AGI)迈出了重要一步。该模型在写真视频效果上超越了Sora,展现了其在视觉生成方面的卓越能力。 4月27日,在中关村论坛的通用人工智能平...
-
Sora大片真相:人工特效参与,被指误导大众
啊?Sora火爆短片《气球人》,也“造假”了??? 背后艺术家团队的最新揭秘,可谓一石激起千层浪: 原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。 be like: 这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI...
-
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。 训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。 尤其在多模态任务中,这一问题尤为突出。 一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模...
-
中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。 据悉,Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达...
-
无界AI算法总监邹国平:Midjourney领跑,没有标准答案的文生图,下半场还能怎么卷?
撰稿 | 李美涵 采访 | 云昭 嘉宾 | 邹国平 出品 | 51CTO技术栈(微信号:blog51cto) 进入2024,AI应用落地的步伐悄然加速。 AI文生图产品——连接着千行百业的设计需求,极大地压缩了创意实现的周期——正成为快速掘金的AI领域之...
-
关于面向机器人操作的世界模型的一点思考
最近世界模型的火热似乎能在机器人操作中起到一些至关重要的作用。而对于具身智能来说,现阶段manipulation是最需要突破的点。特别是针对以下long horizon的任务,如何构建机器人“小脑”,来实现各种复杂的操作要求,是当下最需要解决的问题。 是...
-
国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布
快科技4月28日消息,在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。 这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,还在加速迭代提升中。...
-
清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频
生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型,标志着中国在视频生成技术领域的重要进展。 Vidu的主要特点和技术创新包括: 模型结构...
-
图灵诺奖得主等大佬齐聚海淀!清华版Sora震撼首发,硬核AI盛会破算力黑洞
中关村论坛举办以来的首个主题日活动:「人工智能主题日」今日开启! 到场嘉宾,也是星光熠熠,大佬云集,还有着浓浓的国际范儿,与世界顶尖水平接轨。 一共161位嘉宾,近一半是外籍AI大佬和从业者。 而嘉宾阵容也是非常豪华,汇集了国内外30多名院士,还有诺奖、...
-
终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代
【新智元导读】Sora一出,谁与争锋!近日,Sora团队的三位负责人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采访,解读了Sora在模拟现实、预测结果和丰富人类体验等方面带来的变革。 对于视频生成领域,大家一致的看法就...
-
阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话
阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。 如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。 通义APP首批上线了多达80个EMO模板,涵盖了热门歌...
-
OpenAI CEO奥特曼25日最新演讲:只专注于AI局限性的创业者必死!AI也不会违背商业的定律
出品 | 51CTO技术栈(微信号:blog51cto) 就在昨天,黄教主亲手交付了OpenAI全球首块AI超级芯片DGX H200的当天,Sam马不停蹄就前往斯坦福大学的英伟达(NVIDIA)礼堂进行了公开演讲。 图片 Sam Altman4月25日在...
-
Sam Altman:GPT-5,将会比现在的大模型更智能
4月25日晚,斯坦福大学日报消息,OpenAI联合创始人兼首席执行官Sam Altman,在斯坦福大学的英伟达(NVIDIA)礼堂进行了公开演讲,超过1000名学生排队参加此次活动。 Altman表示,从现在的技术创新和功能迭代来看,人类远远没有达到AI的...