-
AI视野:自定义ChatGPT商店下周上线;小冰克隆人正式上线;美图大模型上线;普林斯顿大学提出GEO;英伟达发布文生图模型TrailBlazer
新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 自定义ChatGPT商店下周上线 OpenAI宣布将上线自定义GPT商店,用户可以将自己开发的自定义ChatGPT助手进行分享的平台。这一商店的功能类似于苹果的App...
-
Instruct-Imagen官网体验入口 AI多模态图像生成模型软件免费下载地址
Instruct-Imagen是一个多模态图像生成模型,专注于处理异构图像生成任务,并在未知任务中展现出良好的泛化能力。该模型通过引入多模态指令,利用自然语言整合不同模态(如文本、边缘、风格、主题等),标准化丰富的生成意图。它在预训练文本到图像扩散模型上进...
-
谷歌家务机器人单挑斯坦福炒虾机器人!端茶倒水逗猫,连甩三连弹开打
火爆全网的斯坦福炒虾机器人,一天之内人气暴涨。 毕竟这样能炒菜能洗碗的全能机器人,谁不想带一个回家,把自己从家务中解放出来呢! 据说,这个项目是斯坦福华人团队花了三个月的时间做出来的。 今天,团队直接放出了更多细节。 这个机器人的技能多种多样,令人眼...
-
谷歌DeepMind机器人成果三连发!两大能力全提升,数据收集系统可同时管理20个机器人
几乎是和斯坦福“炒虾洗碗”机器人同一时间,谷歌DeepMind也发布了最新具身智能成果。 并且是三连发: 先是一个主打提高决策速度的新模型,让机器人的操作速度(相比原来的Robotics Transformer)提高了14%——快的同时,质量也没有下滑...
-
多模态运动语言模型MotionGPT 可将语言指令转换为3D人体运动
MotionGPT是一款令人惊叹的技术创新,它统一了语言和运动,将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习,通过混合运动语言数据进行预训练,并通过基于提示的问答任务进行微调,使其具备卓越的性能。 项目地址:https://hu...
-
图解tinyBERT模型——BERT模型压缩精华
译者 | 朱先忠 审校 | 重楼 简介 近年来,大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一,可以高精度地解决各种自然语言处理(NLP)任务。继BERT模型之后,一组其他的模型也先后出现并各自展示出优秀的性能。 不难看到一个明显趋势...
-
人工智能生成内容(AIGC)总览记录(认知篇)!!!
文章目录 一、AIGC 引入 1.1 AIGC 定义 1.2 AIGC 历史沿革(了解) 1.3 AIGC 技术演进 二、AIGC 大模型 2.1 视觉大模型提升 AIGC 感知能力 2.2 语言大模型增强 AIGC 认知能力 2.3 多...
-
OpenAI的ChatGPT、微软的New Bing、百度的文心一言、Google的Bard、阿里云的通义千问
随着 ChatGPT 热潮卷起来,微软发布New Bing、百度发布了文心一言、Google 发布了 Bard,阿里云官方终于也宣布了,旗下的 AI 大模型“通义千问”也正式开启测试! ChatGPT ChatGPT是一种由OpenAI训练的大...
-
斯坦福炒虾机器人爆火全网!华人团队成本22万元,能做满汉全席还会洗碗
今天,会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。 滑蛋虾仁、干贝烧鸡、蚝油生菜,色香味俱全,看着很诱人。 就拿滑蛋虾仁这道菜来说,Mobile ALOHA在烧水的过程中先打上3颗鸡蛋,然后把虾仁放到水中焯熟,平底锅倒入鸡蛋液再加入...
-
Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象
Meta AI最近发布了一项引人注目的技术,他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。 这个系统能够根据多人对话中的语音生成与对话相对应的逼真面部表情、完整身体和手势动作。这些虚拟人物不仅在视觉上非常逼真,而且能够准确地反映出对话中的手...
-
【2024版】最新保姆级stable diffusion安装教程,小白直接点!一键安装,永久使用,stable diffusion下载安装教程!
关于现在非常红火的AI绘画,很多感兴趣的人不知道如何入手,如果你的电脑配置足够好,那么不要犹豫,让我来教你如何在本地电脑全免费运行当下最强大的AI绘画工具——Stable Diffusion 吧!所以本期给大家带来了全新Stable Diffusion 保...
-
大模型中幻觉缓解技术的综合调查
大型语言模型(LLMs)是具有大量参数和数据的深度神经网络,能够在自然语言处理(NLP)领域实现多种任务,如文本理解和生成。近年来,随着计算能力和数据规模的提升,LLMs取得了令人瞩目的进展,如GPT-4、BART、T5等,展现了强大的泛化能力和创造力。...
-
VCoder官网体验入口 AI图像语义理解app软件免费下载地址
VCoder是一个适配器,通过辅助感知模式作为控制输入,来提高多模态大型语言模型在对象级视觉任务上的性能。VCoder LLaVA是基于LLaVA-1. 5 构建的,不对LLaVA-1. 5 的参数进行微调,因此在通用的问答基准测试中的性能与LLaVA-1...
-
微软研究人员推新AI方法,用合成数据改进高质量文本嵌入
微软公司的研究团队最近提出了一种独特且简单的方法,用于生成高质量的文本嵌入。这种新方法仅使用合成数据和极少的训练步骤(少于1,000步),就取得了令人瞩目的成果。相比于现有的方法,该方法不依赖于多阶段的预训练和有限的标记数据微调,避免了繁琐的训练流程和手动...
-
人工智能利用深度学习技术增强高级驾驶辅助系统(ADAS)
译者 | 李睿 审校 | 重楼 人工智能和机器学习利用深度学习技术的优势,使高级驾驶辅助系统(ADAS 发生了重大变革。ADAS在很大程度上依赖深度学习来分析和解释从各种传感器获得的大量数据。摄像头、激光雷达(光探测和测距 、雷达和超声波传感器都是传感器...
-
文心一言: 中国科技 “元实力” 的一次喷发
它没有摧毁,它改变了一切, 它制造了一些新的东西。 目录 勇气与厚积薄发的信心 “元实力”的一次喷发 为创新加油,让未来可期 获取源码?私信?关注?点赞?收藏? 用“不完美小孩”,形容目前的百度文心一言,...
-
从ChatGPT说起,AIGC生成模型如何演进
ChatGPT是继stable diffusion 之后,又一个火出圈的人工智能算法。这火爆程度不仅仅是科研圈子,包括投资圈都为之震惊,大家惊呼人工智能可能真的要取代人类了。网上关于ChatGPT的分析文章已经非常多了,小猿经过高强度的网络冲浪,整理出了A...
-
【AIGC-图片生成视频系列-4】DreamTuner:单张图像足以进行主题驱动生成
目录 一. 项目概述 问题: 解决: 二. 方法详解 a 整体结构 b 自主题注意力 三. 文本控制的动漫角色驱动图像生成的结果 四. 文本控制的自然图像驱动图像生成的结果 五. 姿势控制角色驱动图像生成的结果 2023年的最后一...
-
深度学习实战30-AIGC项目:自动生成思维导图文件,解放双手
大家好,我是微学AI,今天给大家介绍一下深度学习实战30-AIGC项目:自动生成思维导图文件,解放双手,思维导图是一种常见的工具,用于将复杂的信息和概念以图形化方式展示出来。AIGC项目旨在将这种思维导图的创建过程自动化,并通过使用ChatGPT作为生成器...
-
客观看待AI大模型在数字化转型中的地位和作用
“ AI大模型在数字化转型中的作用尚未突破《“以数据为中心的业务变革”之三种范式》中第三种范式的边界”。 自从OpenAI公司研发的机器人聊天程序ChatGPT在2022年11月30日发布以来,在全世界迅速带起了热潮。ChatGPT是AI大模型驱动的自...
-
Text2Immersion官网体验入口 文本到3D沉浸式场景生成AI工具免费下载地址
Text2Immersion是一个创新的工具,专门用于从文本提示生成高质量的3D沉浸场景。该方法首先使用预训练的2D扩散和深度估计模型逐步生成高斯云,然后通过精炼和插值处理来增强生成场景的细节。与传统方法相比,Text2Immersion能够创建包含多种物...
-
微软官方 Copilot AI 编程训练营第一天精华总结
阿七参加的微软官方组织的 Copilot AI 编程训练营开始了,这是第一天。 GitHub Copilot 官方统计,使用 GitHub Copilot 的开发者基本上能极大的提升编码效率、减少重复性代码编码时间且能更加专注于主线任务。 不管这个...
-
百度大模型这一年:文心一言国内首个用户破亿,飞桨开发者超千万
文心一言用户规模破1亿,飞桨的开发者数量达到1070万。 只用短短两个月,文心大模型4.0整体效果又提升了32%。 2023年12月28日,在刚刚过去的 WAVE SUMMIT+2023深度学习开发者大会上,百度揭幕了文心大模型与深度学习平台飞桨的一系列新...
-
肖仰华:走向千行百业的大模型
现如今,我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生,它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用,但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些...
-
[AI绘画] 即插即用!SDXL+T2I-Adapters 高效可控的生成图片
标题:T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文:https://arxiv....
-
同花顺推出问财大模型HithinkGPT 开启内测申请
同花顺问财推出了 HithinkGPT 大模型,采用 transformer 的 decoder-only 架构。提供7B、13B、30B、70B 和130B 五种版本选择,最大允许32k 文本输入,支持 API 接口调用、网页嵌入、共建、私有化部署等能力...
-
谷歌推Bard百度推文心一言:挑战ChatGPT 竞争白热化
雷递网 雷建平 2月7日 在ChatGPT大获成功的推动下,百度宣布将推出类ChatGPT项目,该项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测,面向公众开放。 目前,文心一言在做上线前的冲刺。 2022年9月,百...
-
最强开源大模型?Llama 2论文解读
标题 简介 模型预训练 预训练设置 硬件资源与碳排放 模型评估 模型微调 有监督微调 基于人工反馈的强化学习(RLHF) 人类偏好数据的收集 奖励模型 迭代微调过程 多轮对话控制 RLHF 结果 模型回答的安全性 一直...
-
AIGC初探:提示工程 Prompt Engineering
简介 提升工程是什么 提示工程(Prompt Engineering)是人工智能领域中的一个概念,特别是在自然语言处理(NLP)领域中。它是一种通过设计和优化输入提示来提高AI模型表现的方法。 对于基于转换器的大型语言模型(如OpenAI的GPT...
-
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述
大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其...
-
清华大学研发 LLM4VG 基准:用于评估 LLM 视频时序定位性能
12 月 29 日消息,大语言模型(LLM)的触角已经从单纯的自然语言处理,扩展到文本、音频、视频等多模态领域,而其中一项关键就是视频时序定位(Video Grounding,VG)。 VG 任务的目的基于给定查询(一句描述),然后在目标视频段中定位...
-
这是GPT-4变笨的新解释
变笨的本质是知识没进脑子。 自发布以来,曾被认为是世界上最强大的 GPT-4也经历了多场「信任危机」。 如果说今年早些时候那次「间歇式降智」与 OpenAI 重新设计 GPT-4架构有关,前段时间的「变懒」传闻就更搞笑了,有人测出只要告诉 GPT-4「现在...
-
白杨SEO:怎么用百度指数、微信指数、抖音指数等工具分析关键词流量趋势及发现用户需求?以ChatGPT、文心一言和AI绘画关键词举例
经常有人问我,怎么判断某个关键词有没有流量,流量有多少,流量趋势怎么样,这个关键词背后用户需求是什么等等。白杨SEO今天就再用目前互联网上主流的百度、微信、抖音三个指数工具以ChatGPT、文心一言和AI绘画这三个关键词来举例说明下。 图片在公众号白杨S...
-
人工智能生成内容AIGC是什么?
一、AIGC的概念和特点 AIGC是人工智能生成内容(Artificial Intelligence Generated Content)的简称,指的是利用人工智能技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络(GAN)等方法,自动生成各...
-
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉
大型语言模型(LLM)虽然在诸多下游任务上展现出卓越的能力,但其实际应用还存在一些问题。其中,LLM 的「幻觉(hallucination)」问题是一个重要缺陷。 幻觉是指由人工智能算法生成看似合理但却虚假或有误导性的响应。自 LLM 爆火以来,研究人员...
-
《我的世界》化身AI小镇,NPC居民角色扮演如同真人
注意看,这个方块人正在快速思考面前几位“不速之客”的身份。 原来她是遇到了危险,意识到这一点之后,她马上开始在脑海中搜索策略。 最终,她的方案是先逃跑然后寻求帮助,并马上付诸行动。 与此同时,对面的人也在进行着和她一样的思考…… 这样的一幅场景出现...
-
人工智能揭开拉斐尔名画的秘密:并非完全出自大师之手
12 月 31 日消息,最近,一个 人工智能神经网络在拉斐尔的一幅名画中发现了一个不同寻常之处:其中一幅面孔竟然不是出自拉斐尔本人之手。 这幅画名为《玫瑰圣母(Madonna della Rosa)》,长期以来,学者们一直对这幅画是否是拉斐尔原作争论不...
-
LLaMA模型论文《LLaMA: Open and Efficient Foundation Language Models》阅读笔记
文章目录 1. 简介 2.方法 2.1 预训练数据 2.2 网络架构 2.3 优化器 2.4 高效的实现 3.论文其余部分 4. 参考资料 1. 简介 LLaMA是meta在2023年2月开源的大模型,在这之后,很多开源模型都...
-
【AI绘画】探索艺术与技术的融合:AI绘画的新前景
AI绘画的新前景 1.AI绘画是把双刃剑 2.AI绘画的应用场景 3.AI绘画的技术 4.结语 随着人工智能(AI)技术的快速发展,AI绘画成为了艺术创作领域中备受关注的话题。传统的艺术创作方式受到了AI技术的冲击,为艺术家和观...
-
stable diffusion webui 教程:安装与入门
stable diffusion webui 安装与入门 原理简介 一、源码仓库 二、模型库地址 三、在 Windows 上自动安装步骤 安装Python 安装git 下载源代码 编辑 webui-user.bat 四、如何打开 五、依据文...
-
基础模型+机器人:现在已经走到哪一步了
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
手把手教你通过PaddleHub快速实现输入中/英文本生成图像(Stable Diffusion)
近来,基于Diffusion的文图生成模型比较火,用户输入一句话,模型就可以生成一副对应的图像,还是很有意思的。本文记录了通过PaddleHub快速实现上述任务的过程,以供参考。 1、安装PaddlePaddle PaddleHub底层依赖于百度自研的...
-
一文通透位置编码:从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long
前言 关于位置编码和RoPE 应用广泛,是很多大模型使用的一种位置编码方式,包括且不限于LLaMA、baichuan、ChatGLM等等 我之前在本博客中的另外两篇文章中有阐述过(一篇是关于LLaMA解读的,一篇是关于transformer从零实现...
-
AI绘图模型不会写字的难题,被阿里AnyText破解了
能准确写汉字的AI绘图工具,终于登场了! 包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。 从此,人们终于可以和AI绘图模型的“鬼画符”说再见了。 这款名为AnyText的绘图工具来自阿里巴巴,可以按照指定位置精准地向图中加入文字。 此前的绘...
-
每个开发者都应该知道的6个生成式AI框架和工具
译者 | 晶颜 审校 | 重楼 在快速发展的技术领域,生成式人工智能是一股革命性的力量,它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界,揭示了对每个开发人员都必不可少的框架和工具。 一、LangChain 图片 LangCh...
-
LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr
LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件 实现基于源词表的扩展(中文标记的新词汇 进而实现持续预训练、(init_model.py文件 实现过计算均值来扩展模型的嵌入层以适应新的词汇表,然后保存扩展后的模型...
-
LLaMA, ChatGLM, BLOOM的参数高效微调实践
作者:回旋托马斯x(腾讯NLP算法工程师) 项目地址:https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比 大语言模型的训练分为两个阶段: (1)在海量文本语料上的无监督预训练,学习通用的语义表...
-
【大模型实践】基于文心一言的对话模型设计
文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督...
-
一个超强 Pytorch 操作!!
哈喽,我是小壮! 这几天关于深度学习的内容,已经分享了一些。 另外,类似于numpy、pandas常用数据处理函数,在Pytorch中也是同样的重要,同样的有趣!! Pytorch同样提供了许多用于数据处理和转换的函数。 今儿来看下,最重要的几个必会函数...
-
4、stable diffusion
github 安装anaconda环境 conda env create -f environment.yaml conda activate ldm 安装依赖 conda install pytorch==1.12.1 torchvision=...