-
人工智能 | 360自研可控布局AI绘画模型HiCo发布
龙年春意伊始,360人工智能研究院正式发布新的AI绘画模型:可控布局生成模型HiCo。与大家所熟悉的文生图模型相比,HiCo在普通的文本输入之上,提供了更为强大的画面布局控制能力:用户可以根据自己的构思,指定在画面不同的区域生成不同的指定内容,实现A...
-
LLMs之llama3-from-scratch:llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码)的简介、核心思路梳理
LLMs之llama3-from-scratch:llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码 的简介、核心思路梳理 导读:这篇论文实现了transformer网络的llama3模型...
-
Stable Diffusion支持多人排队使用
如果我们想要自己在云服务器上部署Stable Diffusion模型,但是又不想自动扩容造成成本激增,我们可以设计排队使用的模式。stable-diffusion-webui已经很好用了,支持了自定义模型及Lora模型的加载、排队生成、完善的UI和各种插件...
-
大模型到底有没有智能?一篇文章给你讲明明白白
生成式人工智能 (GenAI[1] 和大语言模型 (LLM[2] ,这两个词汇想必已在大家的耳边萦绕多时。它们如惊涛骇浪般席卷了整个科技界,登上了各大新闻头条。ChatGPT,这个神奇的对话助手,也许已成为你形影不离的良师益友。 然而,在这场方兴未艾的...
-
迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入,利用多模态大语言模型的多...
-
有哪些好的 Stable Diffusion 提示词(Prompt)可以参考?
看完这八种“提示词”种类,你也会Ai高质量出图! 作为一个老法师,Prompt需要我们自己搜集,然后总结。很多人习惯于通过教程和模型来学习绘画,沿着别人预设的轨道前行,这样一开始没有错,但是长久缺乏自主思考和创造的能力,机械式的学习方式只会限制个人的表达...
-
Stable Diffusion学习记录
文章目录 前言 电脑配置推荐 环境搭建 下载地址 安装步骤 步骤一,打开下载的秋叶整合包,路径秋叶整合包/sd-wenui-aki 步骤二,打开下载好的sd-webui-aki-v4.8.7解压包 Stable Diffusion软件配...
-
儿童节变身小小音乐家,用ModelArts制作一张AIGC音乐专辑
本文分享自华为云社区《儿童节变身小小音乐家,用ModelArts制作一张AIGC音乐专辑》,作者: 华为云社区精选。 儿童节,如何给小朋友准备一份特别的礼物? 这份AIGC音乐专辑制作攻略一定要收下 一段文字灵感就能编织出一曲悠扬悦耳的旋律 童话、...
-
Midjourney 参数详解(MJ参数)
官方地址: Midjourney Parameter ListParameters are added to a prompt to change how an image generates. Parameters can change an imag...
-
太兴奋了!Stable Diffusion WebUI v1.9.0它来了~重大更新!超详细讲解!
大家好,我是程序员晓晓 距上次 WebUI v1.8的更新发布刚刚过去一个多月,Stable Diffusion WebUI 这次又又又更新了,老徐关注到Stable Diffusion WebUI作者UTOMATIC1111就在前几天在GitHub...
-
Midjourney可以通过接口调用啦
在数字艺术创作领域,Midjourney一直以其出色的图片生成效果受到广泛关注。然而,由于需要通过discord界面操作等一系列限制,也给很多用户带来了不便。现在,通过日月摘星接口,用户可以直接访问和调用midjourney,大大简化了操作...
-
AI领域的赛博佛祖,他的名字,叫张吕敏。
前两天,AI绘图圈的赛博佛祖张吕敏,又出手了,发了一个挺牛逼的新项目,叫Omost。 简而言之,Omost的作用就是,把简单的一句话,扩展成非常牛逼、详细且精准的Prompt,然后挨个画出各种不同的区域,最后合成在一起。 注意,是合成,所以精准可控能力极...
-
【AIGC调研系列】LlamaFS-使用llama3操作文件夹
LlamaFS是一个基于Llama 3模型的自组织文件管理系统,旨在帮助用户自动重命名和组织电脑中的文件。它通过智能化的AI技术,能够根据文件内容和已知约定(例如时间)自动进行文件的重命名和分类整理[1][5][8]。 LlamaFS有两种运行模式:批量...
-
训练Stable Diffusion(XL) Lora的图片是否需要caption?
intro 目前很多风格lora模型的训练都会对图片进行caption,训练风格lora时使用image caption步骤是否能带来正向的效果? 在sdxl的代码实现中,lora插入的位置为unet中cross attention的QKV的线性投影部...
-
〔003〕Stable Diffusion 之 界面参数和基础使用 篇_stable diffusion 参数设置
✨ 目录 ▷ 界面参数 ▷ 采样器 ▷ 文生图(txt2img) ▷ 图生图(img2img) ▷ 标签权重 ▷ 模型下载 ▷ 界面参数 在使用 Stable Diffusion 开源 AI 绘画之前,需要了解一下绘画的界面...
-
ChatGPT4o被越狱了,有人拿来搞大尺度!
你好啊,我是轩辕。 大家知道,为了防止AI被用于不法用途,各家的AI大模型都设置了一些安全防护措施。 当你尝试让AI去做一些可能涉及到违法的事情时,它会直接拒绝。 图片 然鹅,信息技术的发展总伴随着安全攻防对抗的产生,AI也不例外。 这不,现在就有这么一...
-
Stable Diffusion Web UI Windows部署及坑
文章目录 1、准备 2、Miniconda安装 3、git安装 4、安装CUDA 4、开始部署 遇到的坑 1、准备 官网 需要翻墙软件 最少6G内存,显卡在2060以上 2、Miniconda安装 这是一个运行pytho...
-
ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜
Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。 文章地址:https://simonwillison.net/2024/May/29/trai...
-
【AI绘画】Stable Diffusion魔法修习—“画风“自由切换(stable diffusion模型下载与使用技巧)
stable diffusion模型文件指AI学习了大量指定风格图片后,存储了这些学习信息的文件,可以用来绘制特定风格的图片。 大模型chickpoint(检查点 :可以理解为保存指定节点的模型文件。训练模型特别耗算力,保存到指定节点之后,可以方便下次继...
-
Midjourney软件介绍及使用教程
文章主要有四个部分: 一、Midjourney安装教程(简单略过); 二、认识AI绘图指令; 三、MJ常用后缀参数指令; 四、文本提示词 注:Mj不是修图的工具,只是语言的工具。只是修图的辅助工具,做图要结合PS来. 第一部分:Midjou...
-
ollama部署体验Chinese-LLaMA-Alpaca-3大模型项目
前言 书接上回:快速评测已有的中文llama-3开源模型(4月25日更新)_llama3-chinese-novel-CSDN博客 虽然Llama-3大模型发布以后,中文适配模型也出了一大堆,但效果都不尽人意,参差不齐。近期,Chinese-LLaMA...
-
LMDeploy高效部署Llama-3-8B,1.8倍vLLM推理效率
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,LMDeploy 对 Llama 3 部署进行了光速支持,同时对 LMDeploy 推理 Llama 3 进行了测试,在公平比较的条件下推理效率是 vLLM 的 1.8 倍。 书生...
-
Midjourney新功能:角色参照指南
基本概念 角色参照(Character Reference):这个功能允许用户在不同的图像生成中保持给定参照角色的一致性。 适用模型:适用于Midjourney V6和Niji6型号。 功能亮点 跨风格一致性:可以在不同风格(如动漫风、写实...
-
AIGC时代之 - 怎样更好的利用AI助手 - 指令工程
爆火的AIGC 2022年11月30日,OpenAI发布ChatGPT 3 2022年12月4 日,ChatGPT 3 已拥有超过一百万用户 2023年各种大语言模型开始火爆全球 GPT们,已经成为了我工作和学习的非常重要的工具。 ChatGPT...
-
开发arXiv论文引擎机器人程序:基于RAG+LangChain+Chainlit+ChromaDB
译者 | 朱先忠 审校 | 重楼 简介 在本文中,我将演示如何使用检索增强生成(RAG 技术构建语义研究论文引擎。具体地说,我将使用LangChain(https://www.langchain.com/ 作为构建语义引擎的主要框架,以及OpenAI公...
-
【AIGC】本地部署 ollama(gguf) 与项目整合
首先,先跟各位小伙伴说一句 Sorry 。上一篇文章《【AIGC】本地部署通义千问 1.5 (PyTorch 》并没有考虑企业成本问题,虽然代码可以跑通,但是中小型企业想通过该代码实现项目落地还是比较困难的。为此,本文将采用 GGUF 预量化大模型结合 O...
-
Stable Diffusion插件(翻译)
Agent Scheduler(代理调度器):一个用于排队和跟踪任务历史的工具,使得管理生成任务变得井井有条。 TemporalKit(时间稳定工具包):这是一个全能解决方案,通过一个自动化扩展,为Stable Diffusion渲染添加时间稳定性,保持...
-
我的stable-diffusion入门
开头 翻到一个感兴趣的帖子,然后开始了这段折腾 载下来用了,发现用的是cpu出图,慢的很,还是需要stable diffusion webui来做,所以就开始找资料 参考链接 找模型:https://civitai.com/https://hug...
-
知识图谱检索增强的GraphRAG(基于Neo4j代码实现)
图检索增强生成(Graph RAG)正逐渐流行起来,成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性,将数据以节点和关系的形式组织起来,从而增强检索信息的深度和上下文关联性。图在表示和存储多样化且相互关联的信息方面具有天然优势,能够轻松捕...
-
Stable Diffusion 使用技巧与具体操作(详细)
Stable Diffusion 是一种基于扩散模型的图像生成技术,能够生成高质量的图像。以下是一些详细的使用技巧与具体操作,帮助你更好地利用这一技术进行创作。 1. 基本概念 Stable Diffusion 利用扩散过程生成图像,通过逐步添加噪声并...
-
stable diffusion常用的模型
一、Checkpoint模型 1.1、二次元模型 可以搭配负面提示词优化EasyNegative使用 1.1.1 counterfeitV30_v30.safetensors C站地址:https://civitai.com/models/4...
-
安装部署Stable Diffusion WebUI实现AI绘画
Stable Diffusion WebUI 安装部署 环境准备 下载代码 启动webu.sh 访问WebUI 其他异常 其他设置 开启VAE和CLIP 部分参数说明 安装插件 中文汉化插件 安装civitai插件 提示词插件 ol...
-
【AIGC调研系列】Dify平台是什么
Dify平台是一个专为大型语言模型(LLM)开发和运营设计的LLMOps(Large Language Model Operations)平台。它旨在简化AI应用的创建、部署和管理过程,使开发者能够更快速、更轻松地构建和运营基于GPT等模型的AI应用。...
-
欢迎 Llama 3:Meta 的新一代开源大语言模型
介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Fac...
-
从零开始学AI绘画,万字Stable Diffusion终极教程(二)
【第2期】关键词 欢迎来到SD的终极教程,这是我们的第二节课 这套课程分为六节课,会系统性的介绍sd的全部功能,让你打下坚实牢靠的基础 1.SD入门 2.关键词 3.Lora模型 4.图生图 5.controlnet 6.知识补充...
-
百度文心一言api Python调用ERNIE-Lite-8K-0922具体教程
ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE-Lite-8K-0922(原ERNIE-Bot-turbo-0922)是模型的一个模版,本文介绍了相关API及应用。 创建chat...
-
ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文
ControlNet作者新项目,居然也搞起大模型和Agent了。 当然还是和AI绘画相关:解决大伙不会写提示词的痛点。 现在只需一句超简单的提示词说明意图,Agent就会自己开始“构图”: 这就是ControlNet作者Lvmin Zhang的新玩具...
-
Midjourney教程(完整版)-看这篇就够了
Midjourney使用指南 - 订阅计划费用比较 Midjourney 具有三个订阅版本。按月或全年支付可享受 20% 的折扣。每个订阅计划都包括访问 Midjourney 图库、官方 Discord、一般商业使用条款等。 如何订阅 使用...
-
基于 Llama-Index、Llama 3 和 Qdrant,构建一个 RAG 问答系统!
构建一个使用Llama-Index、Llama 3和Qdrant的高级重排-RAG系统 尽管大型语言模型(LLMs)有能力生成有意义且语法正确的文本,但它们面临的一个挑战是幻觉。 在LLMs中,幻觉指的是它们倾向于自信地生成错误答案,制造出看似令人信...
-
AI绘画Stable Diffusion | 手把手教你做卡通头像
大家好,我是画画的小强 “ ai绘画是最新生产力,咱首先学会制作卡通人物头像(证件照),快速掌握个人变现能力……” 近期火爆的妙鸭相机,据说要替代天真蓝和海马体的节奏,仅需9.9元就可以在线拍一套个人写真集,只需上传20张不同角度的个人照片。 听起来...
-
AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型 轻松文生视频
AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型 ?轻松文生视频 学习前言 源码下载地址 技术原理储备(DIT/Lora/Motion Module) 什么是Diffusion Transformer (DiT ...
-
stable diffusion的从安装到使用
stable-diffusion,一个免费开源的文生图软件,文章主要讲怎么从源码开始安装,以及使用的方式 git地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui 本人电脑环境win10...
-
Sora底层技术原理:Stable Diffusion运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊...
-
LLaMA参数微调方法
1.Adapter Tuning:嵌入在transformer中 新增了一个名为adapter的结构,其核心思想是保持模型其他原始参数不变,只改变adapter的参数,其结构如下图所示: 1.在每一个transformer模块最后都加入一层ada...
-
Stable Diffusion插件:提示词
很多同学使用Stable Diffusion生成图片时,之所以做不出高质量的图片,很大程度上是由于不知道怎么写提示词,常常陷入词穷的窘境,要么不知道该写点啥,要么翻译出来的英文不是很贴切。今天我就给大家分享几个Stable Diffusion WebUI的...
-
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)
基于LlaMA 3 + LangGraph 在windows本地部署大模型 (一) RAG 是未来人工智能应用的基石。大家并不是在寻求仅仅产生无意义反应的人工智能。而目标是人工智能能够从特定文档集中检索答案,理解查询的上下文,指导自己搜索其嵌入内容...
-
Stable Diffusion教程|快速入门SD绘画原理与安装
什么是Stable Diffusion,什么是炼丹师?根据市场研究机构预测,到2025年全球AI绘画市场规模将达到100亿美元,其中Stable Diffusion(简称SD)作为一种先进的图像生成技术之一,市场份额也在不断增长,越来越多的人参与到AI掘金...
-
AI、AGI、AIGC、AI Agent、Prompt、LLM 名词解释
啊!ChatGPT 最近很火呀,你们说的 AGI、AIGC、AI Agent、Prompt、LLM … 到底是什么意思啊?还有 Midjourney、Lensa、Sora、DALL-E、Llama … 又是什么鬼? AI(Artificial Int...
-
Ai绘画工具Stable Diffusion,最全提示词使用指南!建议收藏!
今天给大家分享的是Stable Diffusion提示词相关内容。 文章目录 一、基本概述 二、提示词顺序 三、提示词权重 四、连接词 五、分步渲染 六、调用Lora 七、提示词资源 八、常用提示词中英文对照表 写在最后 一、...
-
AI绘画Stable Diffusion美得令人心动亚洲女性大模型
大家好,我是程序员晓晓。 在SD 1.5时代,有一款非常受欢迎的亚洲女性大模型XXMix_9realistic。该模型生成的亚洲女性图片,有以下几个特点。 面容较好,在保证人物真实感上增加一点轻度美颜的效果 手部表现比较好 比较出色的光影表...