-
AI作画算法详解:原理、应用与未来发展
随着人工智能技术的不断发展,AI作画逐渐成为了一个热门话题。AI作画,即利用人工智能算法生成绘画作品,不仅仅是技术的展示,更是艺术与科技结合的创新体现。本文将深入探讨AI作画的核心算法原理,并通过实例帮助读者更好地理解和掌握这一技术。 文章最后,给大家推...
-
LLama Factory微调模型全流程,与peft库调用训练的adapter
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 LLama Factory微调流程 一、准备微调的数据集和模型 二、读取模型和数据进行训练 1.使用web ui 2.修改官方脚本(推荐) 第三,加载与推...
-
LLaMA-Factory在华为显卡上的实验记录
如何判断目前所选择的模型是否支持 LLaMA-Factory/src/llamafactory/data/template.py 在项目的这个地址中会有不同模型的支持模版。 这里用目前我最常用的两个模型举例子 一个是智谱的glm4-9B模型 _regi...
-
【人工智能】一文看懂 LLaMA 2:原理、模型与训练
LLaMA 2(Large Language Model for AI Modeling and Assistance)是近年来广受关注的大规模语言模型之一。它被广泛应用于自然语言处理(NLP)任务,如文本生成、机器翻译和问答系统。本文将深入介绍LLaMA...
-
喜欢画画,这拦不住的啊(Stable Diffusion进阶篇:ComfyUI 高清放大)
大家好我是极客菌!!! 高清放大 在AI绘画中给生成出来的图片通过高清修复或者超分辨率的手段放大尺寸是非常常见的,在之前学习过的WebUI中就有文生图的高清修复(Hi-res fix 、图生图的SD放大(SD Upscale 以及后期处理中的算法放大。...
-
[AIGC] python遍历以及字符串的切片
以下是一篇关于Python遍历方法和字符串切片的文章,以及一个在LeetCode中的问题进行解释。文章最后会给出解题思路和代码实现。 Python遍历方法与字符串切片入门教程 在Python语言中,我们包含了许多内置的函数和方法令其适合于各种数据处理...
-
How Stable Diffusion was built: Tips and tricks to train large AI models
How's everyone doing? Yay. Thank you for being your last session for us today. I'm sure you're waiting for your beers right now....
-
从头开始学习扩散模型 Stable Diffusion
今天我们来揭开 Stable Diffusion 技术的神秘面纱。 1.稳定扩散原理 Stable Diffusion 在2022年发表,一种基于Latent Diffusion Models的新兴机器学习技术。它基于扩...
-
JS逆向批改网实现自动提交作文 调用文心一言API自动生成作文
前天熬了个大夜,下午一点才起,一听到舍友说又要写那个恶心的批改网,气得我直接写了个脚本自动把所有未完成的作文秒杀,话不多说直接开始分析。 一.登陆前的cookies处理 清空网站的所有本地存储,会话存储和cookies,并刷新 可以看到多出了两个...
-
anytext_pytorch AIGC 可以用于生成多语言文字图像算法模型
AnyText 论文 AnyText: Multilingual Visual Text Generation And Editing https://arxiv.org/abs/2311.03054 模型结构 模型由4部分构成,分别是Auxili...
-
100% 压榨 GitHub Copilot 指南
大家好,我是楷鹏。 早在 OpenAI 推出 ChatGPT 之前,OpenAI 就已经和 GitHub 合作推出了 GitHub Copilot。 下文统一简称 Copilot Copilot 当时在编程圈引起轰动。 当时激进的说法是:...
-
【Llama 2的使用方法】
Llama 2是Meta AI(Facebook的母公司Meta的AI部门)开发并开源的大型语言模型系列之一。Llama 2是在其前身Llama模型的基础上进行改进和扩展的,旨在提供更强大的自然语言处理能力和更广泛的应用场景。 以下是Llama 2的一...
-
Stable Diffusion低显存也能跑大图了,再也不用怕爆显存!
Stable Diffusion(以下简称SD)是一款很强大的AI绘画软件,很多人都会拿SD和MJ(Midjourney)作对比,其中最重要的一点就是使用门槛上,SD需要最低也是4GB的显存,如果显存低了是没办法获得很好的体验的,最佳的配置是12-24GB...
-
搭建本地whisper语音识别
目录 代码仓库 编辑 选择模型 环境配置 语音识别测试 Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 代码仓库 GitHub - ope...
-
调研分析:LLama大模型
1. 引言 在当前的自然语言处理(NLP)研究中,大规模预训练模型如BERT、GPT-3和RoBERTa已经展示了其卓越的性能和广泛的应用。随着技术的发展,新的模型不断涌现,推动了NLP领域的持续进步。本文将聚焦于LLama模型,分析其结构、预训练策略、优...
-
OpenAI穿着「皇帝的新衣」;扒了数万条帖子汇总100种AIGC玩法;北美出海的财务避坑指南;我创业「如」有CTO | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! 1. 我扒了 Reddit 论坛数万条帖子,汇总了 GenAI 的 100 种玩法 ChatGPT 已经问世一年半了。这期间诞生了很多大语言模型和生成式人工...
-
如何训练一个stable diffusion模型?
提前总结 显卡要好,显存要高 素材像素要好,数量越多越好 素材不必要的元素越少越好,太多就扣像留白底 要好好的打标签,影响最终效果 硬件要求 建议N卡且显卡显存至少8G,显存越高越好(即价格越贵越好); 4G需要调整参数,而且速度较慢,不推荐...
-
[AIGC] 图论基础入门
图论是数学的一个分支,旨在研究图(graph)的属性和应用。这是一个跨学科领域,因为图论可以用于描述和解决各种实际问题。如社交网络分析,电脑网络,生物网络等。 文章目录 什么是图? 图的基本性质 LeetCode 图论相关问题解析及...
-
【AIGC半月报】AIGC大模型启元:2024.06(下)
AIGC大模型启元:2024.06(下) (1 Gen-3 (2 Open-Sora 1.2(Open-Sora再升级) (3 Claude 3.5 Sonnet(Claude升级) (4 ChatTTS v3(ChatTTS升级) (...
-
stable diffusion图生图重绘原图尺寸系统崩溃
*** Error completing request *** Arguments: ('task(edxse6e6xomcsl5 ', <gradio.routes.Request object at 0x0000024671E57EE0>...
-
《AI聊天类工具之五——Copilot》
一.简介 官网:Microsoft Copilot: 你的日常 AI 助手 Copilot是微软在Windows 11操作系统中引入的一款先进的AI助手。这款工具集成在操作系统的侧边栏中,旨在帮助用户完成各种任务。它依托于底层大语言模型(LLM),...
-
Python爬虫入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
初学Python之爬虫的简单入门 一、什么是爬虫? 1.简单介绍爬虫 爬虫的全称为网络爬虫,简称爬虫,别名有网络机器人,网络蜘蛛等等。 网络爬虫是一种自动获取网页内容的程序,为搜索引擎提供了重要的数据支撑。搜索引擎通过网络爬虫技术,...
-
[大模型]Llama-3-8B-Instruct FastApi 部署调用
环境准备 在 Autodl 平台中租赁一个 3090 等 24G 显存的显卡机器,如下图所示镜像选择 PyTorch-->2.1.0-->3.10(ubuntu22.04 -->12.1。 接下来打开刚刚租用服务器的 JupyterL...
-
Mistral AI 发布 Codestral-22B,精通 80+ 编程语言,22B 参数超越 70B Code Llama
前言 大型语言模型 (LLM 在代码生成领域展现出巨大的潜力,但现有的模型在支持的编程语言数量、生成速度和代码质量方面仍存在局限性。法国 AI 独角兽 Mistral AI 近期发布了其首款代码生成模型 Codestral-22B,宣称在多项指标上超越...
-
stable diffusion 提示词进阶语法-学习小结
stable diffusion 提示词进阶语法 前言 提示词语法 基础正向提示词 基础负面提示词 可选正向提示词(特写镜头提示词) 进阶语法1——提示词注释 进阶语法2——and连接词 进阶语法3——BREAK阻断 前言 A...
-
【AIGC评测体系】大模型评测指标集
大模型评测指标集 (☆)SuperCLUE (1)SuperCLUE-V(中文原生多模态理解测评基准) (2)SuperCLUE-Auto(汽车大模型测评基准) (3)AIGVBench-T2V(文生视频基准测评) (4)SuperCLUE-C...
-
Stable Diffusion本地安装详细教程(Mac篇)
01引言 今天给大家重点介绍下AI绘图工具——Stable-Diffusion-WebUI。大家都知道Midjourney生成图片效果很惊艳,其实Stable Diffusion是目前开源免费且最好用的本地运行AI绘画工具。 Stable Diffus...
-
LLama-Factory大模型训练框架,基于自己数据集微调qwen7B模型实战
一,项目简介 LLama-Factory,大模型训练框架,支持多种模型,多种训练方式, 项目github地址:link 项目特色 多种模型:LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baic...
-
AIGC专栏12——EasyAnimateV3发布详解 支持图&文生视频 最大支持960x960x144帧视频生成
AIGC专栏12——EasyAnimateV3发布详解 支持图&文生视频 最大支持960x960x144帧视频生成 学习前言 项目特点 生成效果 相关地址汇总 项目主页 Huggingface体验地址 Modelscope体验地址 源...
-
小白上手AIGC-基于PAI-DSW部署Stable Diffusion文生图Lora模型
小白上手AIGC-基于PAI-DSW部署Stable Diffusion文生图Lora模型 前言 资源准备 开启体验服务 创建工作空间 部署服务 创建DSW实例 安装Diffusers 启动WebUI 写在最后 前言 在上...
-
AI绘画Stable diffusion最强大的功能:ControlNet插件详解
大家好,我是程序员晓晓 在之前的几篇文章中我已经陆续地介绍过Stable diffusion的一些基础功能,接下来要介绍的是Stable diffusion中稍微难一点的,但同时也是比较实用的功能:ControlNet。 简单来说,ControlNet...
-
如何快速接入llama 3 ?送上最便捷教程
一、Meta llama 3介绍 当地时间4月18日,Meta 发布两款开源Llama 3 8B与Llama 3 70B模型。 按照Meta的说法,Llama 3 8B和Llama 3 70B是目前同体量下,性能最好的开源模型。 在Llama...
-
【Python】科研代码学习:十六 Model架构的代码细节,附架构图:Llama 为例 (v4.28.0)
【Python】科研代码学习:十六 Model与网络架构 的代码细节:Llama 为例(v4.28.0) 前言 导入依赖 `LlamaRMSNorm`:改进的 层正则化 `LlamaRotaryEmbedding`:旋转式位置编码 `Llama...
-
推荐开源项目:Purple Llama - 开放式生成AI的负责任构建工具集合
推荐开源项目:Purple Llama - 开放式生成AI的负责任构建工具集合 Purple Llama 是一个综合性的项目,旨在通过提供工具和评估方法,帮助社区在开放的生成人工智能模型上进行负责任的开发。这个项目不仅关注技术的可能性,更重视安全性和...
-
ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%
【新智元导读】6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用ChatGPT写代码的最...
-
陶哲轩点破「天机」:不懂数学别想靠ChatGPT飞升!
【新智元导读】冲锋在AI辅助数学研究第一线的陶哲轩,近日又有「神总结」:ChatGPT提升的,是我们在编码、图表等次要任务上的能力;而真要搞好数学研究,基础不扎实的话,AI也是没用的。 使用ChatGPT一年半了,陶哲轩的感想如何? 最近,一直冲锋在探索A...
-
AIGC生成论文汇总
1.1 无特定身份人物生成(Non-identity Generation) (1 变分自动编码器(Variational Auto-Encoder) 2022, CVPR,Shunyu Yao, RuiZhe Zhong, Yichao Ya...
-
深入浅出理解 AI 生图模型 Stable Diffusion
Stable Diffusion 概述 为了降低理解成本,我会尽量减少有关数学的知识点,并尽量用类比的方式,帮助你理解一些概念。所以有可能出现不够严谨的情况,如果你有更好的解释,欢迎留言。 Stable Diffusion(稳定扩散)严格说来...
-
GitCode Copilot强大的代码助手
Github Copilot是由GitHub和OpenAI联合开发的一款人工智能(AI)驱动的代码助手。它基于大量的开源代码和编程语言知识进行训练,可以帮助开发人员快速生成高质量的代码片段。本文将介绍如何使用Github Copilot以及它的常用快捷键。...
-
whisper.cpp 学习笔记
whisper.cpp whisper.cpp 学习笔记 whisper 介绍 源码下载 源码编译 支持的模型 优化/加速 生成库文件 使用 whispe.cpp 的 demo 参考文献 whisper.cpp 学习笔记...
-
[240625] Continue -- 开源 Copilot | Web-Check 网站分析工具 | Story of EOL
目录 Continue -- 开源 Copilot Web-Check 网站分析工具 Web-Check 提供全面的网站分析功能 Web-Check 支持多种部署方式: 配置选项 开发环境 Web-Check 使用多种数据源进行分析 Sto...
-
[AI Stability] 开源AI新利器:Stable Diffusion 3 Medium震撼发布!文本到图像再升级!
Stable Diffusion 3 Medium(SD3 开源了,我们来看下。 关键要点 Stable Diffusion 3 Medium 是 Stability AI 迄今为止最先进的文本到图像开源模型。 该模型的体积小巧,非常适合在消费级...
-
Stable Diffusion 3 开源发布可下载体验
本文来自huggingface翻译 Stable Diffusion 3 Medium是一种多模态扩散变换器 (MMDiT 文本到图像模型,其在图像质量、排版、复杂提示理解和资源效率方面的性能有极大提升。 有关更多技术细节,请参阅研究论文。 请注意:此...
-
【Stable Diffusion 3】本地部署SD3详细教程
? Hi, I’m @Beast Cheng ? I’m interested in photography, hiking, landscape… ? I’m currently learning python, javascript, kotlin…...
-
AIGC:生成式模型简介
AIGC:生成式模型简介 变分自编码器(VAE) 生成对抗网络(GAN) 自回归模型(Autoregressive Model) 流模型(Flow Model) 扩散模型(Diffusion Model) 此博客将从原理、优点和缺点几...
-
结合RNN与Transformer双重优点,深度解析大语言模型RWKV
本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 RWKV 模型架构深度解析》,作者:Freedom123。 一、前言 Transformer模型作为一种革命性的神经网络架构,于2017年由Vaswani等人 提出,并在诸多任务中...
-
AIGC工具全面解析: 优缺点一目了然
目录 AIGC工具全面解析: 优缺点一目了然 优点 1. 准确性高 2. 多领域支持 3. 自动学习和迭代 缺点 1. 可能存在较高的错误率 2. 受限于训练数据 3. 缺乏主动性和创造力 结论 AIGC工具全面解析: 优缺点一...
-
AI绘画-Stable Diffusion 原理介绍及使用
引言 好像很多朋友对AI绘图有兴趣,AI绘画背后,依旧是大模型的训练。但绘图类AI对计算机显卡有较高要求。建议先了解基本原理及如何使用,在看看如何实现自己垂直行业的绘图AI逻辑。或者作为使用者,调用已有的server接口。 首先需要说明的是,AI绘图和...
-
视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等
VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...
-
文献研读|AIGC溯源场景及研究进展
前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。 相关文章:针对文生图模型的AIGC检测论文研读,参见此篇文章。 如下图所示,在AIGC生成阶段,有4种溯源场景: 1)生成模型溯源训练数据 2)微调模型溯源预训练模型 3)AI...