-
如何训练一个stable diffusion模型?
提前总结 显卡要好,显存要高 素材像素要好,数量越多越好 素材不必要的元素越少越好,太多就扣像留白底 要好好的打标签,影响最终效果 硬件要求 建议N卡且显卡显存至少8G,显存越高越好(即价格越贵越好); 4G需要调整参数,而且速度较慢,不推荐...
-
[AIGC] 图论基础入门
图论是数学的一个分支,旨在研究图(graph)的属性和应用。这是一个跨学科领域,因为图论可以用于描述和解决各种实际问题。如社交网络分析,电脑网络,生物网络等。 文章目录 什么是图? 图的基本性质 LeetCode 图论相关问题解析及...
-
【AIGC半月报】AIGC大模型启元:2024.06(下)
AIGC大模型启元:2024.06(下) (1 Gen-3 (2 Open-Sora 1.2(Open-Sora再升级) (3 Claude 3.5 Sonnet(Claude升级) (4 ChatTTS v3(ChatTTS升级) (...
-
stable diffusion图生图重绘原图尺寸系统崩溃
*** Error completing request *** Arguments: ('task(edxse6e6xomcsl5 ', <gradio.routes.Request object at 0x0000024671E57EE0>...
-
《AI聊天类工具之五——Copilot》
一.简介 官网:Microsoft Copilot: 你的日常 AI 助手 Copilot是微软在Windows 11操作系统中引入的一款先进的AI助手。这款工具集成在操作系统的侧边栏中,旨在帮助用户完成各种任务。它依托于底层大语言模型(LLM),...
-
Python爬虫入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
初学Python之爬虫的简单入门 一、什么是爬虫? 1.简单介绍爬虫 爬虫的全称为网络爬虫,简称爬虫,别名有网络机器人,网络蜘蛛等等。 网络爬虫是一种自动获取网页内容的程序,为搜索引擎提供了重要的数据支撑。搜索引擎通过网络爬虫技术,...
-
[大模型]Llama-3-8B-Instruct FastApi 部署调用
环境准备 在 Autodl 平台中租赁一个 3090 等 24G 显存的显卡机器,如下图所示镜像选择 PyTorch-->2.1.0-->3.10(ubuntu22.04 -->12.1。 接下来打开刚刚租用服务器的 JupyterL...
-
Mistral AI 发布 Codestral-22B,精通 80+ 编程语言,22B 参数超越 70B Code Llama
前言 大型语言模型 (LLM 在代码生成领域展现出巨大的潜力,但现有的模型在支持的编程语言数量、生成速度和代码质量方面仍存在局限性。法国 AI 独角兽 Mistral AI 近期发布了其首款代码生成模型 Codestral-22B,宣称在多项指标上超越...
-
stable diffusion 提示词进阶语法-学习小结
stable diffusion 提示词进阶语法 前言 提示词语法 基础正向提示词 基础负面提示词 可选正向提示词(特写镜头提示词) 进阶语法1——提示词注释 进阶语法2——and连接词 进阶语法3——BREAK阻断 前言 A...
-
【AIGC评测体系】大模型评测指标集
大模型评测指标集 (☆)SuperCLUE (1)SuperCLUE-V(中文原生多模态理解测评基准) (2)SuperCLUE-Auto(汽车大模型测评基准) (3)AIGVBench-T2V(文生视频基准测评) (4)SuperCLUE-C...
-
Stable Diffusion本地安装详细教程(Mac篇)
01引言 今天给大家重点介绍下AI绘图工具——Stable-Diffusion-WebUI。大家都知道Midjourney生成图片效果很惊艳,其实Stable Diffusion是目前开源免费且最好用的本地运行AI绘画工具。 Stable Diffus...
-
LLama-Factory大模型训练框架,基于自己数据集微调qwen7B模型实战
一,项目简介 LLama-Factory,大模型训练框架,支持多种模型,多种训练方式, 项目github地址:link 项目特色 多种模型:LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baic...
-
AIGC专栏12——EasyAnimateV3发布详解 支持图&文生视频 最大支持960x960x144帧视频生成
AIGC专栏12——EasyAnimateV3发布详解 支持图&文生视频 最大支持960x960x144帧视频生成 学习前言 项目特点 生成效果 相关地址汇总 项目主页 Huggingface体验地址 Modelscope体验地址 源...
-
小白上手AIGC-基于PAI-DSW部署Stable Diffusion文生图Lora模型
小白上手AIGC-基于PAI-DSW部署Stable Diffusion文生图Lora模型 前言 资源准备 开启体验服务 创建工作空间 部署服务 创建DSW实例 安装Diffusers 启动WebUI 写在最后 前言 在上...
-
AI绘画Stable diffusion最强大的功能:ControlNet插件详解
大家好,我是程序员晓晓 在之前的几篇文章中我已经陆续地介绍过Stable diffusion的一些基础功能,接下来要介绍的是Stable diffusion中稍微难一点的,但同时也是比较实用的功能:ControlNet。 简单来说,ControlNet...
-
如何快速接入llama 3 ?送上最便捷教程
一、Meta llama 3介绍 当地时间4月18日,Meta 发布两款开源Llama 3 8B与Llama 3 70B模型。 按照Meta的说法,Llama 3 8B和Llama 3 70B是目前同体量下,性能最好的开源模型。 在Llama...
-
【Python】科研代码学习:十六 Model架构的代码细节,附架构图:Llama 为例 (v4.28.0)
【Python】科研代码学习:十六 Model与网络架构 的代码细节:Llama 为例(v4.28.0) 前言 导入依赖 `LlamaRMSNorm`:改进的 层正则化 `LlamaRotaryEmbedding`:旋转式位置编码 `Llama...
-
推荐开源项目:Purple Llama - 开放式生成AI的负责任构建工具集合
推荐开源项目:Purple Llama - 开放式生成AI的负责任构建工具集合 Purple Llama 是一个综合性的项目,旨在通过提供工具和评估方法,帮助社区在开放的生成人工智能模型上进行负责任的开发。这个项目不仅关注技术的可能性,更重视安全性和...
-
ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%
【新智元导读】6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用ChatGPT写代码的最...
-
陶哲轩点破「天机」:不懂数学别想靠ChatGPT飞升!
【新智元导读】冲锋在AI辅助数学研究第一线的陶哲轩,近日又有「神总结」:ChatGPT提升的,是我们在编码、图表等次要任务上的能力;而真要搞好数学研究,基础不扎实的话,AI也是没用的。 使用ChatGPT一年半了,陶哲轩的感想如何? 最近,一直冲锋在探索A...
-
AIGC生成论文汇总
1.1 无特定身份人物生成(Non-identity Generation) (1 变分自动编码器(Variational Auto-Encoder) 2022, CVPR,Shunyu Yao, RuiZhe Zhong, Yichao Ya...
-
深入浅出理解 AI 生图模型 Stable Diffusion
Stable Diffusion 概述 为了降低理解成本,我会尽量减少有关数学的知识点,并尽量用类比的方式,帮助你理解一些概念。所以有可能出现不够严谨的情况,如果你有更好的解释,欢迎留言。 Stable Diffusion(稳定扩散)严格说来...
-
GitCode Copilot强大的代码助手
Github Copilot是由GitHub和OpenAI联合开发的一款人工智能(AI)驱动的代码助手。它基于大量的开源代码和编程语言知识进行训练,可以帮助开发人员快速生成高质量的代码片段。本文将介绍如何使用Github Copilot以及它的常用快捷键。...
-
whisper.cpp 学习笔记
whisper.cpp whisper.cpp 学习笔记 whisper 介绍 源码下载 源码编译 支持的模型 优化/加速 生成库文件 使用 whispe.cpp 的 demo 参考文献 whisper.cpp 学习笔记...
-
[240625] Continue -- 开源 Copilot | Web-Check 网站分析工具 | Story of EOL
目录 Continue -- 开源 Copilot Web-Check 网站分析工具 Web-Check 提供全面的网站分析功能 Web-Check 支持多种部署方式: 配置选项 开发环境 Web-Check 使用多种数据源进行分析 Sto...
-
[AI Stability] 开源AI新利器:Stable Diffusion 3 Medium震撼发布!文本到图像再升级!
Stable Diffusion 3 Medium(SD3 开源了,我们来看下。 关键要点 Stable Diffusion 3 Medium 是 Stability AI 迄今为止最先进的文本到图像开源模型。 该模型的体积小巧,非常适合在消费级...
-
Stable Diffusion 3 开源发布可下载体验
本文来自huggingface翻译 Stable Diffusion 3 Medium是一种多模态扩散变换器 (MMDiT 文本到图像模型,其在图像质量、排版、复杂提示理解和资源效率方面的性能有极大提升。 有关更多技术细节,请参阅研究论文。 请注意:此...
-
【Stable Diffusion 3】本地部署SD3详细教程
👋 Hi, I’m @Beast Cheng 👀 I’m interested in photography, hiking, landscape… 🌱 I’m currently learning python, javascript, kotlin…...
-
AIGC:生成式模型简介
AIGC:生成式模型简介 变分自编码器(VAE) 生成对抗网络(GAN) 自回归模型(Autoregressive Model) 流模型(Flow Model) 扩散模型(Diffusion Model) 此博客将从原理、优点和缺点几...
-
结合RNN与Transformer双重优点,深度解析大语言模型RWKV
本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 RWKV 模型架构深度解析》,作者:Freedom123。 一、前言 Transformer模型作为一种革命性的神经网络架构,于2017年由Vaswani等人 提出,并在诸多任务中...
-
AIGC工具全面解析: 优缺点一目了然
目录 AIGC工具全面解析: 优缺点一目了然 优点 1. 准确性高 2. 多领域支持 3. 自动学习和迭代 缺点 1. 可能存在较高的错误率 2. 受限于训练数据 3. 缺乏主动性和创造力 结论 AIGC工具全面解析: 优缺点一...
-
AI绘画-Stable Diffusion 原理介绍及使用
引言 好像很多朋友对AI绘图有兴趣,AI绘画背后,依旧是大模型的训练。但绘图类AI对计算机显卡有较高要求。建议先了解基本原理及如何使用,在看看如何实现自己垂直行业的绘图AI逻辑。或者作为使用者,调用已有的server接口。 首先需要说明的是,AI绘图和...
-
视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等
VideoChat VideoChat🦜: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...
-
文献研读|AIGC溯源场景及研究进展
前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。 相关文章:针对文生图模型的AIGC检测论文研读,参见此篇文章。 如下图所示,在AIGC生成阶段,有4种溯源场景: 1)生成模型溯源训练数据 2)微调模型溯源预训练模型 3)AI...
-
一文为你深度解析LLaMA2模型架构
本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 大咖深度解析LLaMA2 模型架构》,作者: Freedom123。 一、前言 随着人工智能技术的不断发展,自然语言处理(NLP)领域也取得了巨大的进步。在这个领域中,LLaMA展...
-
推荐一款革命性代码助手 - Ollama Copilot
🚀 推荐一款革命性代码助手 - Ollama Copilot 在程序员的世界里,一个好的辅助工具就像是一位智慧的导师,能指引我们突破编程的迷雾,让代码书写变得轻松而高效。今天,我将为大家带来一个全新的开源项目——Ollama Copilot。它不仅融合了...
-
开源大模型 Llama 3
开源大模型Llama 3是一个在多个领域都展现出卓越性能的大模型。下面将为您介绍Llama 3的特性和一些简单的使用案例。 一、Llama 3介绍 Llama 3在Meta自制的两个24K GPU集群上进行预训练,使用了超...
-
【AI原理解析】— 文心一言模型
目录 模型架构 Transformer模型 编码器-解码器结构 训练过程 预训练 微调 关键技术 知识增强 上下文感知 个性化生成 推理与生成 应用场景 问答系统 文本生成 对话系统 模型架构 Trans...
-
零基础入坑爬虫—Python网络爬虫的应用实战以及数据采集
前言 简单来说互联网是由一个个站点和网络设备组成的大网,我们通过浏览器访问站点,站点把HTML、JS、CSS代码返回给浏览器,这些代码经过浏览器解析、渲染,将丰富多彩的网页呈现我们眼前; 博主今天有个小目标—带领大家正式入坑爬虫! 想要学习爬虫却一...
-
欢迎 Stable Diffusion 3 加入 Diffusers
作为 Stability AI 的 Stable Diffusion 家族最新的模型,Stable Diffusion 3(SD3 现已登陆 Hugging Face Hub,并且可用在 🧨 Diffusers 中使用了。 Stable Dif...
-
Stable Diffusion 3 大模型文生图“开源英雄”笔记本部署和使用教程,轻松实现AI绘图自由
备受期待的Stable Diffusion 3(以下亦简称SD3)如期向公众开源了(Stable Diffusion 3 Medium),作为Stability AI迄今为止最先进的文本生成图像的开源大模型,SD3在图像质量、文本内容生成、复杂提示理解和资...
-
Stable Diffusion | ComfyUI API 工作流自动优化
ComfyUI 可直接保存生图工作流为 API 格式,但该 API 格式文本行数较多且节点顺序与逻辑执行顺序不一致,不利于编写或修改 API 的调用代码。 在上一篇文章 Stable Cascade | ComfyUI API 工作流格式优化 中介绍了...
-
深入探索Llama 2:下一代开源语言模型的革新与影响
Llama 2是Meta AI发布的一款先进的开源大模型,属于大型语言模型(LLM)类别。它是Transformer架构的一种变体,经过预先训练并在多种文本和代码数据集上进行微调,旨在提升功能和安全性。Llama 2的关键特点包括: 庞大的训练数据集...
-
论文研读|针对文生图模型的AIGC检测
前言:人工智能生成内容的鉴别(AIGC检测)算是当前的研究热点之一,本篇文章介绍几篇针对文生图模型的 AIGC 检测相关工作。 相关文章:AIGC溯源相关研究详见此篇文章 目录 1. Towards Universal Fake...
-
AIGC 生成对抗网络、大型预训练模型 LLM ChatGPT Transformer LLaMA LangChain Prompt Engineering 提示工程
AIGC AIGC(Artificial Intelligence Generated Content)是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。AIGC的爆发得益于GAN、...
-
在Pycharm使用Github Copilot
文章目录 1.GitHub Copilot 是什么 2.注册GitHub Copilot 3.官方使用文档 4.安装 GitHub Copilot插件 5.在Pycharm中使用 6.相关功能键 7.启用或禁用 GitHub Copilot...
-
Llama源码解析之tokenizer.py
llama/llama/tokenizer.py at main · meta-llama/llama · GitHub # Copyright (c Meta Platforms, Inc. and affiliates. # This soft...
-
探索多模态智能边界:Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南
探索多模态智能边界:Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南 在人工智能领域,多模态学习正逐渐成为研究热点,它旨在融合视觉和语言信息,构建能够理解和生成跨模态内容的智能体。Visual-Chinese-LLaMA...
-
Pycharm登录github copilot插件报错:code:-32603或64334,魔法上网,全局代理,改HTTP端口,修改本地全局变量等依旧没用后的解决方案。
打开本地文件:C:\Windows\System32\drivers\etc\hosts,以管理员方式修改hosts文件,直接在末尾添加如下内容: 140.82.112.25 alive.github.com 140.82.114.6 api.gi...
-
AIGC入门(一) 从零开始搭建Transformer!(上)
前言 我记得曾经看过一篇综述,综述里曾这样讲过: 多模态使用Transformer作为基石模型的一个原因之一,就是因为它能够很好地统一视觉(ViT、DiT)和文本,并且无限制地扩大其参数。这是一个在工程上很有作用也很有实际意义的事情。 笔者...