-
LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界
斯坦福华人退学博士开发的Pika,让AI技术和艺术迸发出了绚丽的火花。 最近,又有斯坦福的华人研究人员提出的新的框架——WonderJourney, 可以用一句话或者一张图,自动生成一系列3D场景的连续画面,效果炫酷! 图片 用一张爱丽丝奇境漫游的图片,...
-
谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物
谷歌AR&VR与佛罗里达中央大学的研究团队合作,发布了一项名为“VALID”的虚拟人物库,旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物,代表七个不同的种族,其中包括亚洲、黑人和白人等。研究采用了全球参与者,并通过数据驱动的面...
-
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作! 仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景: 只需输入一段古诗词,诗中场景立刻映入眼帘: 而且还是来回式的,可以再倒回去的那种: 同一起点可以进入不同场景: 真实场景也可以,其中的...
-
AIGC: 关于ChatGPT中对输出文本进行审核
违禁词 与 logit_bias 参数 前文,通过GPT的API实现了一个简单的聊天机器人, 当然也可以做一些内容审核相关的应用 这里有一个非常核心,需要重点关注的一个方向,就是对于文本的审核 对于一些违禁词,我们需要准确的识别出来,避免出现...
-
Pika官网体验入口 AI视频编辑软件app免费下载地址
《Pika》是一个革命性的AI视频编辑平台,它使得将创意想法转化为视频变得简单有趣。这个平台正在改变AI视频生成的游戏规则。那么,《Pika》在哪里可以体验呢?下面就给大家带来《Pika》官网体验入口和免费app下载地址。 点击前往《Pika》官网体验入...
-
微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%
教大模型调用工具,已经是AI圈关注度最高的话题之一了。 这不,又有一项研究登上最新NeurIPS 2023—— 它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。 相比其它...
-
首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性...
-
什么是AIGC(AI Generated Content, 人工智能生成内容)?
AI生成内容(AIGC,人工智能生成内容)是一种新型的内容创作方式,它继承了专业生产内容(PGC,Professional-generated Content)和用户生成内容(UGC,User-generated Content)的优点,并充分发挥技术优势...
-
Bard AI:训练过程中使用了多少数据?
近年来,人工智能取得了长足的进步,并在科技界掀起了波澜。 随着谷歌最近推出新的人工智能聊天机器人 Bard,人们对这项技术的工作原理以及训练它的内容感到好奇。 人工智能技术的关键组成部分之一是训练过程中使用的数据量,这有助于它更好地理解语言、...
-
ChatGPT的训练数据可以通过“偏离攻击”进行泄露
ChatGPT等大语言模型(LLM)使用来自图书、网站及其他来源的海量文本数据进行训练,通常情况下,训练它们所用的数据是一个秘密。然而,最近的一项研究揭示:它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。 随后,来自谷歌Deep...
-
UCLA推出Chameleon框架 大模型表格数学推理准确率达98.78%
在NeurIPS2023上,UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具,包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块,解决了大型语言模型在实时信息获取和数学推理方面的不足。 Chameleon的核...
-
表格数学推理准确率达98.78%!UCLA推出全新「变色龙推理框架」
在自然语言处理任务中取得显著成就的大型语言模型(LLMs)尽管表现出色,但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。 为了应对这些挑战,来自UCLA等机构的研究人员打造了全新的Chameleon框架,其独特的即插即用模型融合了多种工具,包括...
-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
当GPT-4V充当机器人大脑,可能你都没AI会规划
GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4...
-
胜率达94.08%!李开复Yi-34B最新成绩超过LLaMA2等主流大模型
近期,李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大学伯克利分校主导的LMSYS ORG排行榜中,以1102的Elo评分追平了GPT-3.5。此外,在中文SuperC...
-
直追GPT-4!李开复Yi-34B新成绩公布:94.08%的胜率超越LLaMA2等主流大模型
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布—— 在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT! 图片 不仅如此,在加州大学伯克利分校主导的LMSYS...
-
你真的看懂扩散模型(diffusion model)了吗?(从DALL·E 2讲起,GAN、VAE、MAE都有)
本文全网原创于CSDN:落难Coder ,未经允许,不得转载! 扩散模型简单介绍 我们来讲一下什么是扩散模型,如果你不了解一些工作,你可能不清楚它究竟是什么。那么我举两个例子说一下:AI作画(输入一些文字就可以得到与你描述相符的图像)和抖音大火的...
-
Learn Prompt-Midjourney 图片生成
简介 随着 ChatGPT 的爆火,越来越多的人开始关注并尝试 AI 相关的应用。而图片生成就是其中一个备受瞩目的领域。目前已经有许多图像生成工具,如 Midjourney,Stable Diffusion,DALL-E,Firefly等。本课程主要是以...
-
【多模态】5、BLIP | 统一理解与生成任务 为图像生成更高质量的文本描述
文章目录 一、背景 二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
【AI绘画】Stable Diffusion的介绍及程序示例
Stable Diffusion 1.背景 2.StableD 的原理 3.StableD 的应用 3.1.如何使用 StableD 进行图像生成 3.2 图像生成与编辑 3.2.1 生成新图像 3.2.2 图像编辑 1.背...
-
视觉CV-AIGC一周最新技术精选(2023-11)
PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型(LMM)扩...
-
Imagine with Meta AI官网体验入口 AI文生图工具软件app免费下载地址
《Imagine with Meta AI》是一款利用AI技术的图片生成工具。用户只需通过语音描述所想要的画面,该工具就能自动生成相应的图片。这一创新功能为用户提供了丰富多样的创作可能性。目前,该产品仍处于内测阶段,用户需要登录后才能使用生成功能。那么,想...
-
2023年度AI领域的六大顶级投资者
在当前的创业环境中,利用人工智能 (AI) 的公司数量显着增加。在今年出现的十家独角兽公司中,有六家是基于人工智能的初创公司。这一趋势在业界引起了巨大的轰动,现有的人工智能初创公司的估值也出现了显着的飙升。 这些发展凸显了人工智能在当前商业环境中的重要性...
-
谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将到来的人工智能时代
12月7日消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下所做的努力。 此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2...
-
Stable Diffusion:开启AI魔法绘画的无限可能
? 个人网站:【 海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 随着人工智能技术的蓬勃发展,图像生成和艺术创作领域掀起了一股新的浪潮。在这股浪潮中,St...
-
Meta语音达LLaMA级里程碑!开源MMS模型可识别1100+语言
【新智元导读】Meta的大规模多语言语音 (MMS) 项目将彻底改变语音技术,使用wav2vec 2.0的自监督学习,MMS将语音技术扩展到1100到4000种语言。 在语音方面,Meta又达到了另一个LLaMA级的里程碑。 今天,Me...
-
AIGC产业研究报告 2023——图像生成篇
易观:今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIG...
-
AI文生视频,会在明年迎来“GPT时刻”
在当下的AI赛道上,AI生文、生图的应用,早已层出不穷,相关的技术,也在不断日新月异。 而与之相比,AI文生视频,却是一个迟迟未被“攻下”的阵地。 抖动、闪现、时长太短,这一系列缺陷,让AI生成的视频只能停留在“图一乐”的层面,很难拿来使用,更不要说提供商...
-
【stable diffusion 小白最全详细使用教程+大模型资源】
文章目录 一、前言 二、安装 1.解压后点击启动器运行依赖,然后点击A启动器 2.更新本体和扩展 3.把controlnet1.1放入stable diffusion 中 三、使用界面参数 1.提示词 2.采样和迭代步数 3.修...
-
Meta 、IBM等联合50多家公司结构成立 AI 联盟
标题:Meta 和 IBM 推出 AI 联盟 Meta Platforms 和 IBM 最近联合推出了一个名为 AI 联盟的合作项目,该联盟由50多家人工智能公司和研究机构组成。这个联盟旨在推动一种被称为 “开放模型” 的人工智能发展方式,并希望在快速增...
-
大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种
大模型的“5年高考3年模拟”数学题来了,还是加强强强版! 微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新多模态数学推理基准数据集。 名为“MathVista”。 涵盖各种题型共6141个问题,来源于28个现有的多模态数据集和3个新标...
-
如何在企业中采用生成式人工智能
在企业中嵌入生成式人工智能的用例是什么?它如何帮助减轻重复性管理的负担?它的局限性是什么? 研究机构Gartner公司报告称,在过去三年,全球的风险投资公司在生成人工智能解决方案上投资了逾17亿美元。随着人工智能增强的聊天机器人风靡全球,这种情况只会急...
-
成功实施人工智能的八个步骤
实施人工智能从来不是一件一劳永逸的事情,它需要广泛的战略,以及不断调整的过程。 以下了解企业成功实施人工智能的一些关键的实施步骤,以帮助人工智能和机器学习充分发挥其潜力。 人工智能和机器学习正从商业流行术语转向更广泛的企业应用。围绕战略和采用的努力让...
-
开源语言大模型演进史:向LLaMA 2看齐
本文是开源 LLM 发展史系列文章的第三部分。此前,第一部分《开源语言大模型演进史:早期革新》回顾了创建开源 LLM 的最初尝试。第二部分《开源语言大模型演进史:高质量基础模型竞赛》研究了目前可用的最受欢迎的开源基础模型(即已进行预训练但尚未微...
-
LLaMA模型微调版本:斯坦福 Alpaca 详解
项目代码:https://github.com/tatsu-lab/stanford_alpaca 博客介绍:https://crfm.stanford.edu/2023/03/13/alpaca.html Alpaca 总览 Alpaca 是 L...
-
Pika1.0内测官网体验入口 AI视频制作软件app免费下载地址
《Pika》是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。这个平台主要功能包括支持多种创意想法转视频、提供专业视频效果,同时操作简单易用。《Pika》在哪里可以体验呢?下面就给大家带来《Pika》官网体验入口和免费app下载...
-
专注图表理解,腾讯、南洋理工等开源图表羊驼大模型ChartLlama
在图像理解领域,多模态大模型已经充分展示了其卓越的性能。然而,对于工作中经常需要处理的图表理解与生成任务,现有的多模态模型仍有进步的空间。 尽管当前图表理解领域中的最先进模型在简单测试集上表现出色,但由于缺乏语言理解和输出能力,它们无法胜任更为复杂的问答...
-
SAM&Stable-Diffusion集成进化!分割、生成一切!AI绘画新玩法
自SAM「分割一切」模型推出之后,二创潮就开始了,有想法有行动!飞桨AI Studio开发者会唱歌的炼丹师就创作出SAM进化版,将SAM、Stable Diffusion集成,实现「分割」、「生成」能力二合一,并部署为应用,支持在线使用! 在线免费...
-
Pika1.0官网体验入口 视频制作AI软件免费app下载地址
《Pika》是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。它支持多种创意想法转化为视频,提供专业的视频效果,同时操作简单易用。该平台采用免费试用模式,主要面向创意者和视频爱好者。《Pika》在哪里可以体验呢?下面就给大家带来...
-
文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研
基于近年来图像处理和语言理解方面的技术突破,融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。 文本生成图像(text-to-image)是图像和文本处理的多模态任务的一项子任务,其根据给定文本生成符合描述的真实图像,具有巨大的应用潜力,如...
-
解锁机器学习-梯度下降:从技术到实战的全面指南
本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例,本文旨在为读者提供一种直观且实用的视角,以理解这些优化算法的工作原理和应用场景。 关注TechLead...
-
美国作家协会发起生成式AI调查:保护作家权益与文学多样性
近日,为了解决人工智能生成图书和使用作家素材培训AI的日益关切,作家协会启动了一项公共调查。调查中提出的8个问题,涉及到是否需要作家同意将其作品用于构建和发展AI系统,以及是否应该给予相应的经济补偿。 在一份声明中,作家协会指出:“一些公司擅自抓取数百万本...
-
Smart Copilot:大模型在技术服务和智能客服领域提效的最佳实践
欢迎来到魔法宝库,传递AIGC的前沿知识,做有格调的分享❗ 喜欢的话记得点个关注吧! 随着云计算技术的快速发展,越来越多的企业和个人选择将业务迁移到云端。有很多云厂商为客户提供了灵活、可扩展的计算资源和服务,使得客户能够更加专注于核心业务。 然而,...
-
AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构赢人类800年
陶哲轩一直看好,ChatGPT将颠覆数学证明,而如今,AI在化学领域的潜力同样深不可测。 今天,220万种晶体结构完全被AI预测出来了。 这是什么概念?相当于近800年的知识价值。 谷歌DeepMind开发全新AI工具GNoME,能够预测新材料的稳定性,...
-
百度视频推荐跨域多目标预估与融合的实践和思考
一、百度视频背景介绍 1、统一产品形态 一方面,百度 APP 的所有视频场景已经升级成统一的沉浸式(上下滑)交互形态;另一方面,基于百度统一的大模型,我们打通了所有场景的数据和推荐体验。交互和数据的统一可以更好地实现生态共赢,促进百度视频的长远发展。...
-
AI制作视频——mov2mov以及inpaint
背景 AI制作视频的几种思路 1.从零开始生成:清华的cogview,runway gen-1、gen-2,微软的女娲 这个思路,就是认为可以通过文字描述的方式把视频画面描述出来,通过对文本-视频帧内容-视频内容的数据对的平行语料的学习。学习到文本故...
-
生成式AI游戏开发平台Bitmagic公测,通过文本提示创建游戏
Bitmagic宣布其基于生成式AI的游戏开发平台已进入公测阶段,通过文本提示让玩家轻松创作3D游戏。这一平台是全球首个允许用户通过单一提示创建完全可玩游戏的系统。通过在文本提示中输入描述,玩家可以将创意交给Bitmagic,后者将根据文字内容生成完整可玩...
-
人人都能用好大模型-结构化的Prompt让你轻松上手
Prompt,中文可以翻译为提示词,是一种用于引导大模型生成特定内容的文本输入。Prompt的作用是告诉大模型你想要它做什么,以及给它一些必要的信息和约束条件。Prompt的好坏直接影响了大模型的输出质量和效率。 Prompt的写作是一门艺术,也是一门科...
-
Midjourney 参数合集
探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...