-
华为诺亚的盘古Agent来了,让智能体学会结构化推理
自 AI 诞生以来,开发能够解决和适应复杂工作的多任务智能体(Agent)一直是个重要的目标。 AI 智能体对于许多应用至关重要,研究者通常用强化学习方法通过环境交互来培养智能体的决策技能。基于模型和无模型的深度强化学习方法都已取得了广为人们所知的成就,...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
LLaMA 简介:一个具有 650 亿参数的基础大型语言模型 官网介绍
2023 年 2 月 24 日 更新:我们刚刚推出了Llama 2 - 有关最新信息的更多信息,请参阅我们关于 Llama 2 的博客文章。 作为 Meta 致力于开放科学的一部分,今天我们公开发布 LL...
-
分享10个国内免费的AI绘画工具
谈到 AI 绘画,许多人会联想到 Midjourney、Stable Diffusion、DALL·E2 等国外的知名绘画工具。 然而,这些国外的 AI 绘画工具大部分都是付费的,并且需要借助科学上网才能使用。这两个条件让许多人望而却步。 考虑到很多人...
-
【AIGC】baichuan-7B大模型
百川智能|开源可商用的大规模预训练语言模型baichuan-7B大模型 概述 baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持...
-
【LLM】LLaMA简介:一个650亿参数的基础大型语言模型
LLaMA简介:一个650亿参数的基础大型语言模型 Paper Setup 其他资料 作为 Meta 对开放科学承诺的一部分,今天我们将公开发布 LLaMA (大型语言模型 Meta AI ,这是一个最先进的大型语言基础模型,旨在帮...
-
Llama 2免费托管及API提供
Llama 2 是 Meta 最新的文本生成模型,目前其性能优于所有开源替代方案。 推荐:用 NSDT编辑器 快速搭建可编程3D场景 1、强大的Llama 2 它击败了 Falcon-40B(之前最好的开源基础模型),与 GPT-3....
-
一分钟叫你怎样AI绘画 Vega Ai
先看效果图: 是不是也想自己去创造这样的图片呢,注意已经不需要自己画了!! Vega AI 简介 Vega AI是一款能够 文字生成图片、根据图片+文字进行生成图片、条件生成图片 、根据多张图片训练出自己的风格,在风格广场选择他人制作的...
-
controlnet1.1模型和预处理器功能详解(各预处理器出稿对比及对应模型说明)
ControlNet 1.1 与 ControlNet 1.0 具有完全相同的体系结构,ControlNet 1.1 包括所有以前的模型,具有改进的稳健性和结果质量,且增加并细化了多个模型。 命名规范 项目名+版本号+标识+基础模型版本+功能...
-
Anthropic发布新方法 通过提示降低生成式AI偏见
人工智能公司Anthropic最近发布了一项方法,旨在通过提示工程减少公司使用的大型语言模型(LLMs)输出中的歧视。该公司在一份文件中详细介绍了一种评估方法,指导公司如何通过优化提示降低模型输出的歧视性。该文件为开发人员和决策者提供了了解LLMs生成答案...
-
AIGC专题报告:生成式人工智能人人可用的新时代
今天分享的AIGC系列深度研究报告:《AIGC专题报告:生成式人工智能人人可用的新时代》。 (报告出品方:埃森哲) 报告共计:21页 人工智能发展迎来新拐点 ChatGPT 正在唤醒全球对人工智能(AI) 变革潜力的认知,激发起前所未有...
-
Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言
1.摘要 我们提出了一个多模态框架Video-LLaMA1,它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作,补充线性最小二乘法只处理视觉或听觉信号...
-
开发者笑疯了! LLaMa惊天泄露引爆ChatGPT平替狂潮,开源LLM领域变天
来源: 新智源 微信号:AI-era Meta的LLaMA模型开源,让文本大模型迎来了Stable Diffustion时刻。谁都没想 谁能想到,一次意外的LLaMA泄漏,竟点燃了开源LLM领域最大的创新火花。 一系列表现出色的Chat...
-
together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资
目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic,而这两家公司最大的投资者分别是微软和亚马逊,他们投资的很大一部分不是资金,而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。 在闭源大模型之外,...
-
LLM-项目详解-Chinese-LLaMA-AIpaca(一):LLM+LoRa微调加速技术原理及基于PEFT的动手实践:一些思考和mt0-large+lora完整案例
如何花费较少的算力成本来进行微调训练,十分重要,当前关于LLaMA、Alpaca、Instruct微调、LoRa微调等多个概念大家讲的很多,最近也在学习,也看到几个有趣的话题(主要参考于(https://github.com/ymcui/Chinese-L...
-
欧盟扩大对AI初创公司的支持,提供超级计算机进行模型训练
欧盟计划通过提供超级计算机的处理能力,支持本土 AI 初创公司进行模型训练。该计划于去年9月宣布,并于上个月开始实施。 根据欧盟的最新消息,法国的 Mistral AI 已经参与了早期试点阶段。然而,早期的经验表明,该计划需要为 AI 初创公司提供专门的支...
-
Stable Diffusion - Stable Diffusion WebUI 支持 SDXL 1.0 模型的环境配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132056980 SDXL 1.0 版本 是 Stable Dif...
-
2024 年八大生成式 AI 工具类别
需要为组织的开发项目提供特定于生成式 AI 的工具?探索这些工具所属的主要类别及其功能。 ChatGPT 等生成式AI 服务的普及激发了将这些新工具应用于实际企业应用的兴趣。如今,几乎每个企业应用程序都通过生成式 AI 功能进行了增强。 大多数 AI、...
-
编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源
开源「代码大模型」来了! UIUC清华团队的研究人员发布了Magicoder,不到7B参数,就能在代码生成领域与顶级代码模型不相上下。 值得一提的是,Magicoder的代码、权重和数据,毫无保留完全开源。 论文地址:https://arxiv.org...
-
Gemini自曝文心一言牵出重大难题,全球陷入高质量数据荒?2024年或将枯竭
谷歌Gemini,又出丑闻了! 昨天上午,网友们激动地奔走相告:Gemini承认自己是用文心一言训练中文语料的。 国外大模型用中国模型产生的中文语料训练,这听起来就是个段子,结果段子竟然成现实了,简直魔幻。 微博大V「阑夕」夜亲自下场,在Poe网站上实...
-
AI、零信任、边缘现代化与多云,2024这些技术趋势值得关注
事实上,在这场由ChatGPT激起的新一轮AI浪潮中,全球科技巨头、AI厂商、行业翘楚等纷纷下场,唯恐错过此番科技盛宴。同时,GenAI蓬勃发展产业规模也在高速增长,麦肯锡调查数据显示,2022年GenAI市场收入为400亿美元,预计2027年及203...
-
AI绘画人像promt分享
Promt Checkpoint为基础模型,常用chilloutmix和majicmixRealistic 在设置好checkpoint后,即可设置promt,按照经验来说, promt=Base promt+Description promt+lo...
-
ChatGPT构建离不开PyTorch,LeCun言论引热议,模型厂商不开放权重原来为此
这两天,有关开源的话题又火了起来。有人表示,「没有开源,AI 将一无所有,继续保持 AI 开放。」这个观点得到了很多人的赞同,其中包括图灵奖得主、Meta 首席科学家 Yann LeCun。 想象一下,如果工业界的 AI 研究实验室仍然封闭、没有开源代码...
-
OpenAI「登月计划」剑指超级AI!LeCun提出AGI之路七阶段,打造世界模型是首位
通用AGI,或许近在咫尺。 OpenAI下一步「登月计划」,就是实现人类期待已久的超级人工智能,而到达这一步的前提是——解决超级AI对齐问题。 就在前几天,首席科学家Ilya带头OpenAI超级对齐团队取了的实质性成果。他们发表的最新论文,首次确定了超...
-
突发!OpenAI封禁字节跳动账户!内部爆料滥用GPT生成内容
整理丨诺亚 外媒The Verge于北京时间今日凌晨报道,在生成式AI的疯狂竞赛中,字节跳动一直在秘密利用OpenAI的技术“走捷径”,直指字节跳动在中国使用GPT生成的数据来训练自己的大模型,违反了微软和OpenAI的开发者许可。不久后,OpenAI...
-
本地部署 Stable Diffusion(Windows 系统)
相对于使用整合包,手动在 Windows 系统下本地部署 Stable Diffusion Web UI(简称 SD-WebUI),更能让人了解一些事情的来龙去脉。 一、安装前置软件:Python 和 Git 1、安装 Python for...
-
尊嘟假嘟?2023年人工智能行业新诞生10家独角兽,AIGC竟占近一半
今年的 AIGC 持续热了一年,从王慧文等大佬的入局,到百度发布「文心一言」,各大巨头纷纷发布大模型产品,切实地给中国人工智能赛道的融资添了一把浓烈的火。 回顾这即将过去的一整年,虽然 2023 年投融资整体行业遇冷,各种坏消息不断,但总体而言,AI 行...
-
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理
给你一首曲子的音频和一件乐器的 3D 模型,然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色,看它是钢琴曲还是小提琴曲又或是来自吉他;同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗? 实际上,...
-
源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini
Hugging Face 技术负责人 Philipp Schmid 表示:“代码自动补全工具,如 GitHub Copilot,已被超过一百万开发者使用,帮助他们的编码速度提高了 55%。看到像 Magicoder 和 OSS-INSTRUCT 这样的开...
-
AI绘画 | stable-diffusion的模型简介和下载使用
前言 我们下载完stable-diffusion-ui后还需要下载需要的大模型,才能进行AI绘画的操作。秋叶的stable-diffusion-ui整合包内,包含了anything-v5-PrtRE.safetensors和Stable Diffusi...
-
AIGC迈向通用人工智能时代
一、AIGC“起飞”的背后 2023年1月30日,AIGC概念股突飞猛涨。一时间,AIGC再次站上风口浪尖。 AIGC(AI Generated Content)是指利用人工智能技术来生成内容,被认为是继UGC、PGC之后的新型内容生产方式,常见的A...
-
李彦宏:大家对AI大模型的兴奋点错了 自己着急
快科技12月16日消息,百度李彦宏发言指出,这次大模型技术浪潮是AI过去70年从来没有过的事情,是完全不一样的机会。 李彦宏称:这次不一样之处就在于它的通用性,没有教过的它也能学会。有了这个特点后,当你有一套基础技术能够非常领先的时候,它在各种各样的场景都...
-
下一代自动驾驶系统,少不了大模型,系统调研来了
随着大语言模型 (LLM 和视觉基础模型 (VFM 的出现,受益于大模型的多模态人工智能系统有潜力像人类一样全面感知现实世界、做出决策。在最近几个月里,LLM 已经在自动驾驶研究中引起了广泛关注。尽管 LLM 具有巨大潜力,但其在驾驶系统中的关键挑战...
-
ChatGPT研究(三)——AIGC多模态交互功能,奠定多场景商用基础
✏️写作:个人博客,InfoQ,掘金,知乎,CSDN ?公众号:进击的Matrix ?特别声明:创作不易,未经授权不得转载或抄袭,如需转载可联系小编授权。 前言 最近ChatGPT,想必大家已经是耳熟能详了,一度认为ChatGPT的到来是...
-
【文心一言】使用飞桨 AI Studio 快速搭建,看图识猜成语应用
目录 一、背景 二、实践 三、创建应用 3.1、零代码开发 3.2、应用名称 3.2、模型训练 3.3、开始训练 四、应用部署 4.1、发布项目 4.2、搜索应用 4.3、应用部署 4.4、获取令牌 4.4、导入依赖 4.5、配置CO...
-
AI画图_stable-diffusion-webui安装使用指南(1)
本文章适用于: 有一定学习能力和钻研能力,遇到问题能合理使用搜索引擎尝试解决问题的人 想在windows系统中尝试使用AI作画工具stable-diffusion-webui进行绘画的人 有一定的计算机基础(会魔法上网、知道 python和Git)和英...
-
What the DAAM: Interpreting Stable Diffusion Using Cross Attention
What the DAAM: Interpreting Stable Diffusion Using Cross Attention (Paper reading Raphael Tang, Comcast Applied AI, ACL2023 b...
-
Mistral AI宣布与Google Cloud合作,并发布新的开源LLM
巴黎的人工智能初创公司Mistral AI宣布与Google Cloud签署战略合作,实现了一次重大突破。根据双方的非独占性协议,Mistral AI将利用Google Cloud的AI优化基础设施分发其开源LLM及优化的专有语言模型。谷歌云法国区总经理I...
-
四大AI视频工具“斗法” 一文教你怎么玩
AI视频工具赛道越来越卷,各种升级令人应接不暇,尤其是Gen-2、Pika1.0、Stable Video Diffusion、和Magic Animate,它们正在成为用户最常用的视频生成产品,背后有强大的AI大模型支撑。 尽管目前的视频类大模型还达不到...
-
探索【Stable-Diffusion WEBUI】的插件:画布扩绘(Outpaint)
文章目录 (零)前言 (一)局部重绘(Inpaint) (二)画布扩绘(Outpaint) (2.1)图片画布扩大(插件:OpenOutpaint) (2.2)视频无限缩放(插件:Infinite Zoom) (三)选择合适的模型...
-
stable diffusion实践操作-大模型介绍
本文专门开一节写大模型相关的内容,在看之前,可以同步关注:stable diffusion实践操作 模型下载网站 国内的是:https://www.liblibai.com 国外的是:https://civitai.com(科学上网) 一、发展历史...
-
解锁编程潜能:探索亚马逊CodeWhisperer,打造编程世界的声音引导者
文章目录 前言 一、什么是 Amazon CodeWhisperer? 二、如何使用CodeWhisperer? 安装CodeWhisperer插件 配置CodeWhisperer 生成注释和文档 总结 前言 随着CHATG...
-
AI绘画进军三次元,有人用它打造赛博女友?(diffusion)
目录 1 AI绘画技术飞跃 2 效果展示 3 环境配置 3.1 下载基础模型 3.2 更新.NET和模型 3.3 下载绘画模型 3.4 启动项目 3.5 标签配置 4 结语 1 AI绘画技术飞跃 近期,人工智能技术的发展似乎反...
-
腾讯又整活!一句话让图片变动漫主角!
撰稿 | 清竹 出品 | 51CTO技术栈(微信号:blog51cto) 2023年底,AI圈似乎已经被“文生视频”模型攻占了! 11月底 AI 文生视频工具 Pika 1.0 横空出世、风头一时无两,日前斯坦福大学 AI 科学家李飞飞团队联合谷歌推...
-
stable diffusion打造自己专属的LORA模型
通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自己的训练好的Lora模型放...
-
英国监管机构将审查微软与OpenAI的合作
英国竞争监管机构表示,由于ChatGPT开发者OpenAI的领导层发生变动,已经就微软与OpenAI的合作展开了正式调查。OpenAI是一家总部位于旧金山的人工智能公司,成立为非营利实体,其董事会控制着一个商业单元,而微软是最大的投资者。 图源备注:图片...
-
微软小模型击败大模型:27亿参数,手机就能跑
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。 今天,微软公布了 Phi-2 模型的更多细节以及全新的提示技术 promptbase。这个仅 27 亿参...
-
Hugging News #0814: Llama 2 学习资源大汇总
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...
-
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
大模型现在真的是越来越卷了! 11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。 谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「视频造假」。 就在今天,微软正式发布了曾在11...
-
微软首次推出27亿参数的Phi-2模型,性能超过许多大型语言模型
微软发布了一款名为Phi-2的人工智能模型,该模型表现出了不凡的能力,其性能可媲美甚至超越规模是其25倍的、更大、更成熟的模型。 微软在近日的一篇博文中宣布,Phi-2是一个拥有27亿参数的语言模型,与其他基础模型相比,它在复杂的基准测试中表现出了 "先...