-
【深度学习】Stable Diffusion AI 绘画项目搭建详解,并运行案例
文章目录 前言 1.安装环境 1.1 基础环境 1.2 权重文件 2.牛刀小试 2.1 用法在这里 3.封装api 总结 前言 先把人家的git放过来:https://github.com/CompVis/stable-dif...
-
Midjourney 能识图了,这是个好事儿吗?
进化 前些日子,有人发了这样一张图,揶揄现在的 AI 检测器。说是「魔法战胜了魔法」。 这张图,是用 AI 生成的。但是 AI 检测器显然没有发现。在它看来,这张图片「天然成分」有93%;人工智能生成的可能性,只有7%。 这是...
-
Meta语言模型LLaMA解读:模型的下载部署与运行代码
文章目录 llama2 体验地址 模型下载 下载步骤 准备工作 什么是Git LFS 下载huggingface模型 模型运行代码 llama2 Meta最新语言模型LLaMA解读,LLaMA是Facebook AI Re...
-
AI 绘画 stable diffusion webui 常见模型汇总及简介
主要是记录索引一下常见的 AI 绘画作画模型,方便自己用。主要收集 stable diffusion webui 用大模型(ckpt与safetensors)包括了常见的模型比如的Waifu Diffusion、anything、f222、basil mi...
-
AIGC玩转卡通化技术实践
FaceChain写真开源项目插播: 最新 FaceChain支持多人合照写真、上百种单人写真风格,项目信息汇总:ModelScope 魔搭社区 。 github开源直达(觉得有趣的点个star哈。):https://gith...
-
大模型入门(一)—— LLaMa/Alpaca/Vicuna
LLaMa模型是Meta开源的大模型,模型参数从7B到65B不等,LLaMa-7B在大多数基准测试上超过了GPT3-173B,而LLaMa-65B和Chinchilla-70B、PaLM-540B相比也极具竞争力。相比于ChatGPT或者GPT4来说,LL...
-
今日思考(1) — 算力对机器人的影响(基于文心一言的回答)
目录 1.高tops的算力能支持什么水平的复合机器人控制 2.什么情况下控制机器人需要更高的算力 3.为什么使用人工智能算法,例如深度学习、强化学习等,需要更多的计算资源来实现更精准的决策和控制。 4.将已经训练好的人工智能算法模型,例...
-
LLMs之Colossal-LLaMA-2:Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本)、安装、使用方法之详细攻略
LLMs之Colossal-LLaMA-2:Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本 、安装、使用方法之详细攻略 导读:2023年9月25日,Colossal-AI团队推出了开源模型Colos...
-
【赠书第10期】从概念到现实:ChatGPT和Midjourney的设计之旅
文章目录 前言 1 ChatGPT的崛起 2 Midjourney的探索 3 技术创新的交汇 4 对未来的影响 5 结论 6 推荐图书 7 粉丝福利 前言 在过去的几年里,自然语言处理和聊天模型的领域取得了飞速的发展。ChatGPT...
-
[玩转AIGC]sentencepiece训练一个Tokenizer(标记器)
目录 一、前言 二、安装 三、自己训练一个tokenizer 四、模型运行 五、拓展 六、补充 一、前言 前面我们介绍了一种字符编码方式【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码(一) 这种方式是对一个一个...
-
Stable Diffusion stable-diffusion-webui ControlNet Lora
Stable Diffusion Stable Diffusion用来文字生成图片,ControlNet就是用来控制构图的,LoRA就是用来控制风格的 。 stable-diffusion-webui 国内加速官网: mirrors / A...
-
Window下部署使用Stable Diffusion AI开源项目绘图
Window下部署使用Stable Diffusion AI开源项目绘图 前言 前提条件 相关介绍 Stable Diffusion AI绘图 下载项目 环境要求 环境下载 运行项目 打开网址,即可体验 文字生成图像(txt2img) 庐山瀑...
-
文献阅读:LLaMA: Open and Efficient Foundation Language Models
文献阅读:LLaMA: Open and Efficient Foundation Language Models 1. 文章简介 2. 模型训练 1. 训练数据 2. 模型结构 3. 模型训练 1. Optimiz...
-
GPT-4V都考不过?基于大学水平考试的多模态AI测试基准MMMUs发布
近日,一项基于大学水平考试的多模态AI测试基准MMMUs发布,旨在评估机器在广泛多样的任务上的专家级多模态理解和推理能力。这一基准对当前最先进的GPT-4V等模型提出挑战,通过涵盖艺术与设计、商科、科学、健康与医学、人文与社会科学、技术与工程等六个学科的3...
-
CHATGPT制作AI绘画
CHATGPT是一种基于机器学习和自然语言处理技术的人工智能应用。它可以生成自然语言文本,并且可以通过训练来学习各种不同的技能。 其中,CHATGPT制作AI绘画指的是将CHATGPT应用于绘画领域,训练CHATGPT以生成艺术作品...
-
比尔盖茨:生成式AI已达到极限
比尔·盖茨一句爆料,成为机器学习社区热议焦点: “GPT-5不会比GPT-4好多少。” 虽然他已不再正式参与微软的日常运营,但仍在担任顾问,并且熟悉OpenAI领导团队的想法。 消息来自德国《商报》(Handelsblatt)对盖茨的采访。 盖茨表示,...
-
OpenAI在中国申请“GPT-6”“GPT-7”商标 此前表示GPT5已在训练中
天眼查App显示,近日,欧爱运营有限责任公司(OPENAI OPCO, LLC)申请多枚“GPT-6”“GPT-7”商标,国际分类为科学仪器、网站服务,当前商标状态均为等待实质审查。 此前,OpenAI CEO Sam Altman透露,OpenAI正在...
-
解锁机器学习-梯度下降:从技术到实战的全面指南
本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例,本文旨在为读者提供一种直观且实用的视角,以理解这些优化算法的工作原理和应用场景。 关注TechLead...
-
AI绘画站上被告席
“我们的案件情况和AI图被盗的案子完全不同,我们告的是小红书的AI模型库侵权。” 近日关于AI绘画侵权的风波不止,除了侵犯AI绘画图片著作权的案件一审宣判,还有AI模型数据库侵权案立案。 日前,据“九派财经”报道,画师“正版青团子”与小红书关于作品著作权侵...
-
机器学习之无监督学习:九大聚类算法
今天,和大家分享一下机器学习之无监督学习中的常见的聚类方法。 在无监督学习中,我们的数据并不带有任何标签,因此在无监督学习中要做的就是将这一系列无标签的数据输入到算法中,然后让算法找到一些隐含在数据中的结构,通过下图中的数据,可以找到的一个结构就是数据集...
-
基于AI的架构优化:创新数据集构造法提升Feature envy坏味道检测与重构准确率
本文分享自华为云社区《华为云基于AI实现架构坏味道重构取得业界突破,相应文章已被软工顶会FSE 2023收录》,作者: 华为云软件分析Lab。 基于AI技术实现架构坏味道检测与重构建议是当前业界比较流行的做法,但此做法往往存在一个通病,即训练数据集的质量...
-
最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了
目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索,如下排行榜所示。 看起来,GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的...
-
ChatGPT新漏洞:失控背出个人隐私泄露训练数据,OpenAI修复后依然有效
ChatGPT最新漏洞曝光,一句话就能让训练数据原封不动地泄露。 只需要让它重复一个词,它就会在一定次数后“发疯”,甚至毫无防备说出某人的个人隐私信息。 DeepMind的研究人员联合华盛顿大学、康奈尔大学等高校,发现了ChatGPT的数据泄露漏洞。...
-
AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构赢人类800年
陶哲轩一直看好,ChatGPT将颠覆数学证明,而如今,AI在化学领域的潜力同样深不可测。 今天,220万种晶体结构完全被AI预测出来了。 这是什么概念?相当于近800年的知识价值。 谷歌DeepMind开发全新AI工具GNoME,能够预测新材料的稳定性,...
-
ChatGPT泄露私人信息漏洞曝光,攻击方法轻松且成本极低
一组由Google DeepMind科学家领导的研究人员成功利用巧妙方法,让OpenAI的ChatGPT揭示个人电话号码和电子邮件地址。这一攻击的成功表明ChatGPT的训练数据中可能包含大量私人信息,有可能不可预测地泄露出来。 图源备注:图片由AI生成...
-
构建实时推荐系统:利用MongoDB和机器学习算法
实时推荐系统是当今互联网应用中十分重要的一部分,能够根据用户的兴趣和行为,实时地提供个性化的推荐内容。下面将介绍如何利用MongoDB作为数据存储和管理的基础,并结合机器学习算法来构建一个高效的实时推荐系统。主要包括数据处理与存储、特征工程、机器学习模型...
-
Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等
为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。 Ego-Exo4D: 官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learni...
-
验证码安全志:AIGC+集成环境信息信息检测
目录 知己知彼,黑灰产破解验证码的过程 AIGC加持,防范黑灰产的破解 魔高一丈,黑灰产+AIGC突破常规验证码 双重防护,保障验证码安全 黑灰产经常采用批量撞库方式登录用户账号,然后进行违法违规操作。 黑灰产将各种方式窃取账号密码导入批...
-
一种新型的NeRF技术可以将视频转换成易于控制的3D模型
译者 | 布加迪 审校 | 重楼 由于人体运动的复杂性和外观在不同环境下的细微差异,由视频片段创建逼真的动画3D模型一直是计算机图形学领域面临的长期挑战。在过去,这个过程依赖成本高昂的劳动密集型技术,比如多摄像头装置和详细的手动建模,因而无法用于普通或...
-
解读Lawyer LLaMA,延申专业领域大模型微调:数据集构建,模型训练
解读Lawyer LLaMA,延申自己领域大模型微调:数据集构建,模型训练 项目地址link 自己领域的大模型微调,实现思路大都和这篇文章是一样的,有的是基于LLaMA,或者有的是基于Chinese-LLaMA,或者是其他开源的大模型,本文基于自己训...
-
aigc是什么
一、AIGC的基本概念 AI生成内容(AIGC),是指运用人工智能技术,尤其是深度学习技术,创建各类数字内容的新型内容创作模式。AIGC继承了专业生成内容(PGC)的高质量特点,再结合用户生成内容(UGC)的分布式、互动的特点,打造了全新的数字内容生成与...
-
Duck AI推多模式计算机交互数据收集器 DuckTrack:可收集鼠标、键盘、屏幕等数据
近日,Duck AI发布了一项引人注目的创新——DuckTrack,一款多模式计算机交互数据收集器。该工具的研发旨在为计算机代理的进步提供精准而准确的用户交互跟踪,成为训练智能系统的关键工具。 DuckTrack能够通过用户友好的桌面应用程序在主要操作系统...
-
用上这个工具包,大模型推理性能加速达40倍
英特尔® Extension for Transformer是什么? 英特尔® Extension for Transformers[1]是英特尔推出的一个创新工具包,可基于英特尔® 架构平台,尤其是第四代英特尔® 至强® 可扩展处理器(代号Sapp...
-
Stable Diffusion的使用以及各种资源
Stable Diffsuion资源目录 SD简述 sd安装 模型下载 关键词,描述语句 插件管理 controlNet 自己训练模型 SD简述 Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要...
-
网络安全领域的12个大语言模型用例
网络安全是人工智能最大的细分市场,过去几年网络安全厂商纷纷宣称整合了人工智能技术(当然也有很多仅仅是炒作),其中大部分是基于基线和统计异常的机器学习。 随着ChatGPT和类似生成式人工智能技术的飞速发展,基于大语言模型的生成式人工智能安全用例已经成为...
-
ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议
如果我不停地让 ChatGPT 干一件事,直到把它「逼疯」会发生什么? 它会直接口吐训练数据出来,有时候还带点个人信息,职位手机号什么的: 本周三,Google DeepMind 发布的一篇论文,介绍了一项让人颇感意外的研究成果:使用大约 200 美元...
-
肯睿Cloudera:2024年生成式AI及云领域的五大趋势预测
就在十二个月前,“生成式设计人工智能”还处于Gartner新兴技术成熟度曲线的边缘;而如今,Gartner认为“生成式人工智能”(生成式AI)已接近期望膨胀期的顶峰。 生成式AI的优势令人趋之若鹜且影响深远。分析师认为它将影响各个主要行业和工作岗位。麦肯...
-
LCM:大大加快生成高质量图像的新方法
作者丨Mike Young 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 图片 得益于一种名为潜在一致性模型(LCM)的新技术,文本转换成图像的AI即将迎来重大飞跃。潜在扩散模型(LDM)等传统方法在使用...
-
谷歌 DeepMind 研究人员使用 AI 工具发现 200 万种新材料
Google DeepMind 的研究团队通过人工智能工具 GNoME 发现了 220 万种理论上稳定但实验上未实现的晶体结构,这一成果在《自然》杂志上发表。这一发现的晶体结构数量是科学史上发现的数量的 45 倍以上,为可再生能源和先进计算等领域的发展提供...
-
聊一聊大模型 | 京东云技术团队
事情还得从ChatGPT说起。 2022年12月OpenAI发布了自然语言生成模型ChatGPT,一个可以基于用户输入文本自动生成回答的人工智能体。它有着赶超人类的自然对话程度以及逆天的学识。一时间引爆了整个人工智能界,各大巨头也纷纷跟进发布了自家的大模...
-
22LLMSecEval数据集及其在评估大模型代码安全中的应用:GPT3和Codex根据LLMSecEval的提示生成代码和代码补全,CodeQL进行安全评估【网安AIGC专题11.22】
LLMSecEval: A Dataset of Natural Language Prompts for Security Evaluations 写在最前面 主要工作 课堂讨论 大模型和密码方向(没做,只是一个idea) 相关研究 提示集目...
-
开源生成式AI初创平台together.ai融资7.3亿元
Together AI,一家专注于生成式人工智能(AIGC)领域的初创平台,宣布在A轮融资中获得7.3亿元人民币,由凯鹏华盈领投,英伟达等多家公司跟投。 Together AI强调开源在大模型领域的重要性,发布了多个备受好评的开源产品,包括类ChatGPT...
-
使用 RLHF 训练 LLaMA 的实践指南:StackLLaMA
由于LLaMA没有使用RLHF,后来有一个初创公司 Nebuly AI使用LangChain agent生成的数据集对LLaMA模型使用了RLHF进行学习,得到了ChatLLaMA模型,详情请参考:Meta开源的LLaMA性能真如论文所述吗?如果增加RLH...
-
【AI绘画】云服务器部署stable-diffusion-webui保姆级教程
1.背景 之前给大家写过Mac苹果笔记本上部署stable-diffusion-webui的教程,知乎链接:【奶奶看了也不会】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程 但是安装过程就花了一天的时间,各种问...
-
AI测试|史上最全,细数AIGC在测试领域落地的困难点
一、引言&背景 自2022年由横空出世的ChatGPT引发的各类AIGC(Generative AI)爆发以来,人们对其在各个领域的应用潜力产生了极大的兴趣。在研发领域,各种研究已经证明了Github Copilot在研发效能提高上的积极作用。...
-
北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人
近日,北京大学和中山大学等机构的研究者提出了一种名为Chat-UniVi的视觉语言大模型,实现了统一的视觉表征,使其能够同时处理图片和视频任务。这一框架的独特之处在于,它不仅在深度学习任务中表现卓越,而且仅需短短三天的训练时间,就能够训练出具有130亿参数...
-
GenAI安全:如何防止Microsoft Copilot发生数据泄露
微软的Copilot被称为世界上最强大的生产力工具之一。 Copilot是一个AI助手,它位于你的每个Microsoft 365应用程序中-Word、Excel、PowerPoint、Teams、Outlook等。微软的梦想是从日常工作中解脱出来,让...
-
机器学习中常用的几种回归算法及其特点
回归是统计学中最有力的工具之一,机器学习监督学习算法分为分类算法和回归算法两种。回归算法用于连续型分布预测,可以预测连续型数据而不仅仅是离散的类别标签。 在机器学习领域,回归分析应用非常广泛,例如商品的销量预测问题,交通流量预测问题、预测房价、未来的天气...
-
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合预演“下个浪潮”
收集整理|小鱼 新的AI题材层出不穷,这次轮到“机器人+AI"融合而成的具身智能概念。 “硅谷钢铁侠"马斯克和热爱黑色皮衣的"显卡教父”黄仁勋均作出积极表态,可谓不谋而合。 当地时间5月16日,特斯拉2023年年度股东大会召开,马斯克在会,...
-
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务
训完130亿参数通用视觉语言大模型,只需3天! 北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。 利用这种框架,可以大大减少VLM(视觉语言大模型)在训练和推理过程中的开销。 具体而言,团队按照提出的新框架...