-
AI绘画Stable diffusion保姆级教程,看这一篇就够了「安装-配置-画图」
随着chat gpt爆火之后,越来越多的人开始关注人工智能,人工智能相关的其他应用如AI绘画,也再次得到人们的关注。AI绘画的确很上头,最近几天小编也研究一下,这里把研究的过程以及中间遇到的问题整理一下,我这里遇到的问题,相信新入门的小白也会遇到,希望本文...
-
还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
Midjourney虽然出图精美,使用方便,但是出图的灵活性方面是一大硬伤,Stable Diffusion 作为Midjourney的开源替代品,由于其丰富的插件,灵活可控,受到社区的热捧,一直被寄予厚望,这次Stable Diffusion发布了 XL...
-
乌镇峰会十年,“桨”声“心”影里的百度AI
11月8日,2023年世界互联网大会乌镇峰会开幕。世界互联网大会早已成为国内规格最高的科技盛事,是展现全球数字经济最新科技成果的舞台,是观察数字经济潮水奔涌方向的瞭望台,堪称数字经济风向标。在生成式人工智能掀起新一轮技术革命的2023年,乌镇峰会具备承前...
-
LLMs之Code:Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder)、安装、使用方法之详细攻略
LLMs之Code:Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder 、安装、使用方法之详细攻略 导读:2023年08月25日(北京时间 ,Meta发布了Code Llama,一个可以使用文本提示生成...
-
华人团队获最佳论文、最佳系统论文,CoRL获奖论文出炉
自 2017 年首次举办以来,CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。 2023 年的 CoRL 大会...
-
李飞飞团队新作:脑控机器人做家务,让脑机接口具备少样本学习能力
未来也许只需动动念头,就能让机器人帮你做好家务。斯坦福大学的吴佳俊和李飞飞团队近日提出的 NOIR 系统能让用户通过非侵入式脑电图装置控制机器人完成日常任务。 NOIR 能将你的脑电图信号解码为机器人技能库。它现在已能完成例如烹饪寿喜烧、熨衣服、磨奶酪、...
-
Stable Diffusion 本地部署教程
1.前言: 最近看Stable Diffusion开源了,据说比Disco Diffusion更快,于是从git上拉取了项目尝试本地部署了,记录分享一下过程~ 这里是官网介绍:https://stability.ai/blog/stable-diffu...
-
仅开放2个多月 百度:文心一言用户规模已达7000万
快科技11月9日消息,在2023年世界互联网大会乌镇峰会上,百度CTO王海峰披露,文心一言用户规模现已达到7000万。 百度官方发文称,文心一言自8月31日面向全社会开放至今,用户规模达到7000万,场景4300个,应用2492个。 飞桨和文心生态已凝聚8...
-
AI视野:ChatGPT和API发生重大中断;GPTs分阶段推出计划延迟;中国第二批11个大模型备案获批;阿里将开源720亿参数大模型
???AI新鲜事 ChatGPT和API发生重大中断! 11月9日凌晨,OpenAI在官网发布,ChatGPT和API发生重大中断,导致全球所有用户无法正常使用,宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复,但仍然不稳定,会继续进行安全监控...
-
【AIGC】1、爆火的 AIGC 到底是什么 | 全面介绍
文章目录 一、AIGC 的简要介绍 二、AIGC 的发展历程 三、AIGC 的基石 3.1 基本模型 3.2 基于人类反馈的强化学习 3.3 算力支持 四、生成式 AI(Generative AI) 4.1 单模态 4.1.1 生成式语...
-
【原创】用 VisualGLM 进行AIGC多模识别和内容生成
最近几个月,整个AI行业的LLM(大语言模型)蓬勃发展,除了过去传统的纯文字的多模态能力的视觉语言模型,如 GPT-4,ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日,智谱...
-
AI监管争议再起,华尔街对它的热情却丝毫未减
美国政府近期发布一项新的AI法规,也让世界再次把目光放到AI的安全疑虑问题上。 对于开发大模型的公司来说,这项法规要求它们向政府提供更多信息,而这可能会减慢新产品和更新的发布速度。这项法规中的许多规定涉及尚未上市的大型基础模型和AI系统的未来发展,这就...
-
stable diffusion API 调用,超级详细代码示例和说明
本文主要介绍 stable diffusion API 调用,准确来说是对 stable diffusion webui 的 API 调用。接口文档可以查看: http://sd-webui.test.cn/docs 这里的 sd-webui...
-
OpenAI的最新产品对企业业务意味着什么
使企业的GenAI大众化 全球数字化转型咨询公司Publicis Sapient的首席产品官Sheldon Monteiro告诉VentureBeat,随着GPT和更多API的出现,OpenAI已经使之前需要更多技术专业知识的任务变得更容易为普通人所...
-
李彦宏称重复造大模型将造成极大资源浪费 应该卷AI原生应用
在2023年世界互联网大会乌镇峰会上,百度CEO李彦宏发表了对AI大模型的看法。 他认为,繁荣的AI原生应用生态将推动新一轮的经济增长,但开发好用的大模型存在很高的技术壁垒和成本门槛,社会资源不应该浪费在重复造轮上。 他举例说,像微软这样的公司也没有自己...
-
【云栖2023】林伟:大数据AI一体化的解读
本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:林伟 | 阿里云研究员,阿里云计算平台事业部首席架构师,阿里云人工智能平台PAI和大数据开发治理平台DataWorks负责人 演讲主题:大数据AI一体化的解读 今年是AI大爆发的一年,...
-
【AI画画教程】无整合包使用LoRA和Dreambooth训练全流程详解(Linux)
前言 本教程遵循简单原则,不使用任何民间整合包。 目前很多AI画画训练整合包臃肿复杂,教程也是名词乱炖,容易对初学者造成理解误差和使用困难。因为许多整合包都依赖于sd-scripts库,它自身就能支持绝大多数的训练场景,学会这个后,自己也可以根据自己...
-
10分钟定制一个「陈天奇GPT」,OpenAI新品大波实测来袭!Sam Altman降维打击,千家AI初创公司入土
OpenAI首届春晚,创业公司屠杀夜。 正如Sam Altman所言:「我们正在孕育新物种,它们正在迅速增殖。」 图片 可以说,基于OpenAI接口构建创业公司,产品忽然就失去了意义。许多初创公司的产品,已经没有了护城河。 杜克大学教授陈怡然表示,照这个...
-
IBM设立5亿美元风险基金 用以投资AI初创公司
IBM宣布成立了一项5亿美元的企业AI风险基金,旨在投资各类人工智能公司,从初创企业到高增长企业不等。这一举措是IBM在人工智能领域的最新投资,旨在推动企业领域的生成式人工智能(GenAI)技术研究和发展。 IBM的企业AI风险基金的目标是加速企业领域的...
-
深夜炸场,ChatGPT一周年:无需编程,全民定义GPT的时代,来了!
撰稿 | 云昭 深夜又是一场王炸!在ChatGPT发布一周年之际,OpenAI 创始人Altman 在首届开发者大会上全场放大招,台下掌声不断。 无需编程,甚至无需敲键盘,单纯通过语音聊天就能构建一个专属自定义的GPT!这个消息实在太燃了!以至于推特...
-
目标检测标注的时代已经过去了?
在快速发展的机器学习领域,有一个方面一直保持不变:繁琐和耗时的数据标注任务。无论是用于图像分类、目标检测还是语义分割,长期以来人工标记的数据集一直是监督学习的基础。 然而,由于一个创新性的工具 AutoDistill,这种情况可能很快会发生改变。 G...
-
德国初创公司 Aleph Alpha 完成 5 亿美元 B 轮融资,挑战 OpenAI
德国初创公司 Aleph Alpha 在周一宣布,已完成由博世、SAP 和惠普企业等支持的 5 亿美元融资。这家公司构建了自己的大型语言模型,并在 B 轮融资中筹集了这笔新资金,这是该公司的第二轮主要融资,也是一笔不同寻常的巨额 B 轮投资。 这轮融资主...
-
让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)
最近微软一项研究让Llama 2选择性失忆了,把哈利波特忘得一干二净。 现在问模型“哈利波特是谁?”,它的回答是这样婶儿的: 木有赫敏、罗恩,木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈...
-
红帽将IBM Watsonx 代码生成应用于 Ansible 自动化
红帽(Red Hat Inc)近日宣布,搭载IBM watsonx Code Assistant(一种用于信息技术自动化的生成式人工智能服务)的Ansible Lightspeed已全面上市。 该服务于今年5月发布,接受用户输入的提示,并与watson...
-
李开复称其创立的AI公司零一万物估值已超10亿美元 发布大模型Yi-34B
此前,李开复成立了一家初创公司,名为零一万物(01.AI),旨在为中国市场开发本土大型语言模型(LLM)。日前,李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母,在中国显然存在巨大的需求。与世界其他地方不同,中国无法使用OpenAI和Go...
-
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被革命
全球首个生成式机器人Agent发布了! 长久以来,相比于语言或者视觉模型可以在大规模的互联网数据上训练,训练机器人的策略模型需要带有动态物理交互信息的数据,而这些数据的匮乏一直是具身智能发展的最大瓶颈。 最近,来自CMU、清华、MIT,UMass等机构的...
-
字节“开盒”OpenAI所有大模型,揭秘GPT-3到GPT-4进化路径!把李沐都炸出来了
GPT-3究竟是如何进化到GPT-4的? 字节给OpenAI所有大模型来了个“开盒”操作。 结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。 比如: SFT是早期GPT进化的推动者 帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...
-
谷歌推出“先进天气预报 AI”MetNet-3,号称预测结果超过传统物理模型
11 月 3 日消息,谷歌研究院与 DeepMind 合作开发了最新的天气模型 MetNet-3,该模型以之前的 MetNet 和 MetNet-2 为基础,能够提前 24 小时,能够对全球天气情况进行高解析度预测,包括降水、表面温度、风速、风向和体感...
-
Runway的AI视频生成工具Gen-2更新 生成的视频运动更流畅、高清和逼真
总部位于纽约的生成式 AI 视频初创公司 Runway 今天更新了其标志性的文本/图像/视频到视频模型 Gen-2,其更新再度引发AI视频领域关注。 这一更新显著提高了视频的质量和一致性,有人将其称为“具有重大影响的游戏变革”,有人认为这是“生成式AI的关...
-
Gen-2颠覆AI生成视频!一句话秒出4K高清大片,网友:彻底改变游戏规则
这,绝对称得上是生成式AI进程中的里程碑。 就在深夜,Runway家标志性的AI视频生成工具Gen-2,迎来了“iPhone时刻”般的史诗级更新—— 依旧是简单一句话输入,不过这一次,视频效果一口气拉到了4K超逼真的高度! 话不多说,我们直接来看炸裂的效...
-
Luma AI发布Discord机器人Genie,实现文本生成3D模型
硅谷初创公司 Luma AI 专注于将 AI 技术与3D 内容相结合,例如从智能手机视频中生成 NeRF 或其他3D 格式。现在,该公司发布了一个名为 Genie 的 Discord 机器人,用于生成文本到3D。 它可以从文本提示中生成3D内容,并在约20...
-
Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型
Jina AI 公布了其第二代文本嵌入模型的最新进展:jina-embeddings-v2。这个最先进的模型是唯一支持8K(8192个token)上下文长度的开源解决方案。这一成就使其在功能和在大规模文本嵌入基准 (MTEB 排行榜上的性能方面与 Ope...
-
通义千问2.0首发!云计算的“第三次浪潮”来了
10月31日,2023云栖大会在杭州的云栖小镇如期开幕。 《天下网商》从开幕日获悉,今年的云栖大会有两大“回归”,一是阿里云创始人王坚回来了,二是大会主题“计算,为了无法计算的价值”,让人不由联想到8年前的大会主题“为了无法计算的价值。” 2015年,云计...
-
生成式AI的“生产力悖论”:微软已盈利,其他云巨头何时见效?
1987年诺贝尔经济学奖得主鲍勃·索洛有一句名言:“你可以在任何地方看到计算机时代,唯独在生产率统计数据中看不到。”这句名言后来被称之为“生产力悖论”。 索洛的这句话是在计算机时代到来促进巨大生产力繁荣之前发表的。具有讽刺意味的是,繁荣场景随后在20...
-
阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上!
10月31日,在2023云栖大会上,阿里云CTO周靖人表示,面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。在现场,周靖人公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿...
-
独家 | GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E3不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了出来。 但细心...
-
GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E 3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E 3 不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了...
-
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph Model)概念,系统总结并梳理了图大模型相关的概念、挑战和应用;进一步围绕动态性和可解释性,...
-
百度文心一言专业版有哪些新功能 文心一言专业版可以做什么
百度文心一言专业版已经开始接受测试资格申请,用户可在文心一言主页上找到专业版测试入口进行申请。文心一言专业版具体有哪些新功能玩法呢,我们来一起了解下。 百度文心一言专业版已经在官网开启测试申请(点击进入官网)。文心一言专业版和普通版在功能和应用上有所区别...
-
Meta AI研究负责人倡导开源许可制度变革
Meta公司最近发布的大型语言模型Llama2备受争议,因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费,但在开源软件领域,一些人仍对该公司的开放性持有异议。 具体来说,Meta公司的许可协议使Llama2对许多人免费,但它仍然是有限的,...
-
MLCommons宣布成立人工智能安全工作组
人工智能基准组织MLCommons宣布成立人工智能安全(AIS:AI Safety)工作组。AIS将开发一个平台和来自许多贡献者的测试库,以支持不同用例的人工智能安全基准。 人工智能系统为社会提供了巨大利益的潜力,但它们并非没有风险,如有害性、错误信息...
-
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题。 简单来说就是:模型输出的描述与图片内容不相符。 下图中体现了两种幻觉,红色部分错误地描述了狗的颜色(属性幻觉),蓝色部分描...
-
智谱的“GPT-4V”来了,CEO张鹏说他们就是奔着AGI去的
时隔仅仅四个月,智谱大模型再度升级。在沈阳举办的2023中国计算机大会CNCC2023上,智谱介绍了新一代ChatGLM3大模型。 根据智谱官方的表述,尽管新的大模型名字中带有Chat,但实际上这是一个全新版本的基座模型,它的完全版和上一代一样拥有1300...
-
百度王海峰:文心大模型4.0推理性能提升50倍
在近日的第二十届中国计算机大会上,百度首席技术官王海峰表示,百度在3月16日发布知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调...
-
七国集团将就企业开发先进AI系统行为准则达成一致
10月30日消息,一份文件显示,七国集团(G7)将在周一就企业开发先进人工智能(AI)系统的行为准则达成一致。各国政府目前正努力降低人工智能技术被滥用的风险。 这份文件指出,考虑到人工智能可能带来的隐私和安全风险,自愿行为准则将成为主要国家管理人工智能...
-
最好7B模型再易主!打败700亿LLaMA2,苹果电脑就能跑
花500刀“调教”的70亿参数模型,打败700亿参数的Llama 2! 且笔记本就能轻松跑,效果媲美ChatGPT。 重点:免费、不要钱。 HuggingFace H4团队打造的开源模型Zephyr-7B,鲨疯了。 其底层模型是前段时间爆火、由有着“欧...
-
人工智能安全成热点
2023年人工智能安全峰会(AI Safety Summit)将于11月1日和2日在英国标志性的布莱切利公园举行。一些世界领先的科技公司、人工智能专家、政府官员和民间社会团体将参加此次峰会。峰会的主要议程是强调人工智能的风险,重点关注人工智能前沿,并讨论...
-
港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构
图神经网络(Graph Neural Networks)已经成为分析和学习图结构数据的强大框架,推动了社交网络分析、推荐系统和生物网络分析等多个领域的进步。 图神经网络的主要优势在于它们能够捕获图数据中固有的结构信息和依赖关系。利用消息传递和聚合机制,图...
-
草案显示美国准备全力以赴地对快速发展的 AI 技术实施国家规则
根据 POLITICO 获得的一份行政命令草案,美国总统乔·拜登即将动用多个联邦机构,监控人工智能的风险,开发新的技术应用,同时努力保护劳动者。预计该命令将在下周一发布,它将简化高技能移民流程,创建多个新的政府机构和任务组,为联邦政府几乎接触到生活的每个方...
-
DeepMind:谁说卷积网络不如ViT?
深度学习的早期成功可归功于卷积神经网络(ConvNets)的发展。近十年来,ConvNets 主导了计算机视觉基准测试。然而近年来,它们越来越多地被 ViTs(Vision Transformers)所取代。 很多人认为,ConvNets 在小型或中等规...