-
吴恩达老师开源翻译工作流Agent;阿里巴巴开源无需训练即可使用参考图像编辑图像的工具;Whisper Web 浏览器字幕生成
✨ 1: Translation Agent Translation Agent 吴恩达老师开源翻译工作流Agent Translation Agent 是一个基于反思工作流程的机器翻译系统的Python示范。其主要步骤包括: 使用大语...
-
论文笔记:Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization
CVPR2024 论文代码:yangxy/PASD (github.com 论文地址:[2308.14469v3] Pixel-Aware Stable Diffusion for Realistic Image Super-resolution a...
-
AI绘画SD【插件篇】:智能标签提示词插件sd-danbooru-tags-upsampler
大家好,我是c程序员晓晓。 关于智能标签提示词插件,在很早之前就介绍过很多款了,今天再给大家介绍一款智能标签提示词插件sd-danbooru-tags-upsampler。该智能提示词插件是今年2月23号才发布的第一版V0.1.0,算是比较新的智能提示词...
-
github Copilot的使用总结
1. 代码建议和补全 GitHub Copilot 的基本使用涉及编写代码时的实时代码建议和补全。一旦你已经安装并配置好 GitHub Copilot 插件,你可以在支持的编辑器(如 Visual Studio Code)中开始使用 Copilot。以下...
-
五一超级课堂---Llama3-Tutorial(Llama 3 超级课堂)---第三节llama 3图片理解能力微调(xtuner+llava版)
课程文档: https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频: https://space.bilibili.com/3546636263360696/channel/collectiondetail?...
-
Meta Llama 3 性能提升与推理服务部署
利用 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能 我们很高兴地宣布 NVIDIA TensorRT-LLM 支持 Meta Llama 3 系列模型,从而加速和优化您的 L...
-
Llama 3 Web Demo 部署- XTuner 小助手微调- LMDeploy 部署 Llama 3
1 Llama 3 Web Demo 部署 本博客为基于机智流、Datawhale、ModelScope:Llama3-Tutorial(Llama 3 超级课堂)的作业。 1.1 环境部署 使用VSCode远程连接InterStudio开发机,并配...
-
AIGC中的强化学习技术原理与应用
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
stable diffusion生成图片权限报错,PermissionError: [Errno 13] Permission denied: ‘/tmp/gradio/tmpidsfdagq.png
因为我这边用的是远程服务器,我没有管理员权限,所以网上其他人说的sudo什么的方法对我都没有用,我又去找了其他的方法,在https://blog.csdn.net/wandererXX/article/details/136935596 这篇博客里面说到了...
-
windows下使用midjourney (一)
一、midjourney是什么? midjourney 是一款AI绘画工具,输入描述自动生成图片。 二、使用步骤 1.安装anaconda 安装之前先在cmd里输入conda看下有没有安装过,没有的话安装一下 安装完成之后,在安装目录下找到....
-
探秘Whisper Diarization:语音转文字与对话分割的新锐工具
探秘Whisper Diarization:语音转文字与对话分割的新锐工具 项目地址:https://gitcode.com/MahmoudAshraf97/whisper-diarization 项目简介 Whisper Diarization 是...
-
windows11搭建 stable-diffusion-webui
2024年5月22日23:46:57 建议电脑配置 电脑配置: Intel® Core™ Ultra 5 125H 1.20 GHz 32.0 GB (31.6 GB 可用 系统:windows11 注意:最好挂上外网,或者设置好访问github的...
-
从零开始搭建LLaMA-Factory
准备写一个完整教程: 手动卸载原先驱动和cuda(英伟达自带的驱动升级程序闪退崩溃) 官网下载驱动、cuda、cudnn 逐一安装(系统装驱动,cuda与cudnn。然后anaconda虚拟环境装pytorch) 安装llama factory 微调...
-
ubuntu的stable-diffusion-webui安装和大模型使用
需要显卡基于Ubuntu20.04安装输入nvidia-smi有输出,可以查看cuda的版本 一.安装miniconda 1.下载最新的安装文件。在命令行中输入以下命令即可: wget https://repo.anaconda.com/minico...
-
使用LLaMA-Factory来实现微调ChatGLM-3B
前提:本文是使用阿里云的人工智能PAI平台的交互式建模(DSW)来进行的如下操作 安装LLaMA-Factory # 克隆项目 git clone https://github.com/hiyouga/LLaMA-Factory.git # 安装项目...
-
【腾讯云 HAI域探秘】——即时职场生存指南小游戏以及【自行搭建Stable Diffusion图片AI绘制 ChatGLM2-6B AI进行智能对话 Pytorch2
六、jupyter_lab操作步骤 1、进入jupyter_lab操作页面 操作页面效果 2、面板功能介绍 3、启动服务 命令如下,直接复制并【ctrl+v】即可 cd /root/stable-diffusion-webu...
-
区分LLaMA、llama.cpp和Ollama
大模型本地部署和运行中,经常遇到这三个概念,llama,ollama,llama.cpp。 刚开始接触时,的确有些傻傻分不清楚。这里简单区分理解下,方便快速上手。 简单来讲,llama 是一个Meta公司开源的预训练大型语言模型,llama.cpp用于加...
-
完全详细教程:Stable Diffusion ComfyUI本地部署
可能会有人说使用整合包就行了,但按照我的经验来说,使用整合包会出现各种各样的小问题,所以我这里推荐想好好用的朋友还是一步步来安装。 概述 Stable Diffusion ComfyUI 是一款基于开源 Stable Diffusion 文本转图像模型...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图
目前人工智能模型可以分为两大类别,包括判别模型 (Discriminative Model 与生成模型 (Generative Model 。判别模型根据一组输入数据,例如文本、X 射线图像或者游戏画面,经过一系列计算得到相应目标输出结果,例如单词翻译结...
-
mac安装Stable Diffusion
昨天帮别人安装Stable Diffusion,按照别人的文档设置发现一直报错,最后发现是需要先把模型下载好了放置到模型的文件夹后再运行安装。今天就写下整个安装过程。 1、安装Homebrew 复制到终端直接回车运行如下: /bin/bash -c...
-
AIGC-风格迁移-style Injection in Diffusion-CVPR2024HighLight-论文精度
Style Injection in Diffusion: A Training-free Approach for Adapting Large-scale Diffusion Models for Style Transfer-CVPR2024High...
-
使用 GitHub Copilot 进行提示工程简介
了解使用 GitHub Copilot 创建有效提示的要点。探索将编码注释转化为精确、可操作的代码的技术,从而增强您的开发工作流程。 学习目标 学完本模块后,您将能够: 制作有效的提示来优化 GitHub Copilot 的性能,...
-
Copilot安装和使用最全教程
背景 Copilot 是一款由 GitHub 和 OpenAI 合作开发的代码辅助工具。它基于 OpenAI 的大型语言模型 GPT-3.5,专为帮助软件开发者提升编程效率而设计 Copilot的主要功能是通过理解用户输入的代码注释或部分代码片段、自动生...
-
Dream Machine API功能介绍及免费使用指南 LumaAI视频生成接口体验地址入口
Dream Machine API简介 Dream Machine API 是一款专注于自动化视频生成的技术工具。它通过使用 Dream Machine API 来生成视频,并异步检查视频生成状态,最终输出最新生成的视频链接。这款工具为需要自动化视频生成和...
-
用 Unsloth 微调 LLaMA 3 8B
用 Unsloth 微调 LLaMA 3 8B 今年4月份,Meta 公司发布了功能强大的大型语言模型(LLM)Llama-3,为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而,传统的 LLM 微调过程既耗时又耗费资...
-
LLaMa大模型微调
1. 模型的微调 1.1 大模型LLaMa下载 先下载一个完整版本的LLaMa模型,官网的或别人下载微调过的中文版本的。 1.2 指令微调 执行run_clm_sft_with_peft 1.3 合并LORA 大模型的原始参数和微调后的参数...
-
Stable Diffusion Webui--安装与使用
最近进行的课程汇报,学习了2023年的CVPR文章《DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation》,因此尝试使用了几种方法对这篇文章...
-
AI “黏土画风”轻松拿捏,手把手带你云端部署 ComfyUI
作者:鸥弋、筱姜 AI 绘画领域,Stable Diffusion WebUI、Midjourney 、DALL-E 都聚拢了一大批的应用开发者和艺术创作者。ComfyUI 出现时间略晚,但是它让创作者通过工作流的方式,实现自动化水平更高的 AI 生图流...
-
快速识别你家的猫猫狗狗,教你用ModelBox开发AI萌宠应用
本文分享自华为云社区《ModelBox-AI应用开发:动物目标检测【玩转华为云】》,作者:阳光大猫。 一、准备环境 ModelBox端云协同AI开发套件(Windows)环境准备【视频教程】 二、应用开发 1. 创建工程 在Model...
-
【Stable Diffusion】:SDXL1.0大模型的发布给SD带来全新的使用体验
1.Stable Diffusion XL模型是什么? SDXL是stabilityai公司推出的最新的图像大模型,可以使用stable diffusion生成Ai图像,SDXL模型与之前的Stable Diffusion v1-v2.1模型相比,使用...
-
运行stable-diffusion出现的问题(1)
Checkout your internet connection or see how to run the library in offline mode at ‘https://huggingface.co/docs/transformers/ins...
-
Windows部署语音转文字项目_Whisper
Windows部署语音转文字项目_Whisper 一、前置安装准备 Github源仓库,Whisper 下载安装whisper及其依赖项 官方有两种部署方法,一种是通过默认pip源拉取安装: 以管理员身份运行powershell,输入如下命令p...
-
人工智能学习笔记(2):认识和安装Stable Diffusion
人工智能学习笔记(2):认识和安装Stable Diffusion 文章目录 人工智能学习笔记(2):认识和安装Stable Diffusion Stable Diffusion的起源和发展历程 Stable Diffusion的应用...
-
AI绘画Stable Diffusion提示词(Prompt)原理详解,扫盲级教程还请收藏!
阅读本文大概需要 7.88 分钟。 点击上方👆名片后,送你 AI 资料 本文主要分为五部分: 1. 提示词概念详解 2. 提示词分类 & 提示词书写 提示词权重原理 & 负面提示词介绍 4. SD 出图参数详解...
-
【Xiao.Lei】- Copilot插件完全指南:提高开发效率的利器
引言 GitHub Copilot插件是由OpenAI开发的一款基于人工智能技术的开发助手,它能够理解你的代码上下文并为你提供实时的代码建议。本文将深入介绍Copilot插件的安装、配置以及详细使用,帮助你更好地利用这一强大工具提高开发效率。 第一...
-
『SD』Stable Diffusion WebUI 安装插件(以汉化为例)
theme: smartblue 本文简介 点赞 + 关注 + 收藏 = 学会了 Stable Diffusion WebUI 是允许用户自行安装插件的,插件的种类有很多,有将页面翻译成中文的插件,也有提示词补全插件,也有精细控制出图的...
-
LLM 评估汇总:真的吊打 LLaMA-3,媲美 GPT-4 吗?
一、背景 在过去的一年多里,国内在大模型领域的发展异常迅速,涌现出上百个大模型,许多模型已经迭代了多个版本,并且各种指标不断刷新。与此同时,我们也经常在国内的一些文章中看到声称“吊打 LLaMA 3”或“媲美 GPT-4”的说法。那么,国内的大模型真的已...
-
使用 Amazon SageMaker 微调 Llama 2 模型
本篇文章主要介绍如何使用 Amazon SageMaker 进行 Llama 2 模型微调的示例。 这个示例主要包括: Llama 2 总体介绍 Llama 2 微调介绍 Llama 2 环境设置 Llama 2 微调训练 前言...
-
Go最全Stable Diffusion web UI 文档_stable diffusion webui文档(3),2024-2024历年网易跳动Golang面试真题解析
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Go语言开发知识点,真正体系化! 由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后...
-
transformers 阅读:Llama 模型
正文 学习一下 transformers 库中,Llama 模型的代码,学习过程中写下这篇笔记,一来加深印象,二来可以多次回顾。 笔者小白,里面错误之处请不吝指出。 层归一化 LlamaRMSNorm transformers 中对于 Llam...
-
一文解读:Stable Diffusion 3究竟厉害在哪里?
知乎原文:叫我Alonzo就好了 前言 最近一段时间,正当所有人都在为OpenAI发布Sora狂欢时,Stability AI更是推出了Stable Diffusion 3的技术报告。**这两项技术不约而同都采用了Diffusion Transf...
-
上手GitHub Copilot让AI写代码,效率飞起!
1 GitHub Copilot介绍 GitHub Copilot 由 GitHub 和 OpenAI 共同开发的人工智能代码辅助工具,可自动地生成高质量代码片段、上下文信息等。通过自然语言处理和机器学习技术,通过分析程序员编写的代码、注释和上下文信息...
-
手机流畅运行470亿大模型:上交大发布LLM手机推理框架PowerInfer-2,提速29倍
苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。 然而,目前在移动设备上运行的模型相对较小(苹果的是3B,谷歌的是2B),并且消耗大量内存,这在很大程度上限制了其应用场景。 即使是苹果,目前也需要与OpenAI合作,通过将云端GPT-4...
-
一键生成透明底图像!教你用AI绘画开源 SD 插件实现素材自由!
大家好,这里是和你们一起探索 AI 的程序员晓晓~ AI 绘画自出现以来一直都在不断发展完善,实现了很多我们在实际应用中迫切需要的功能,比如生成正确的手指、指定的姿势、准确的文本内容等。上周,又一个重磅新功能在开源的 SD 生态内实现了——直接通过文本直...
-
探索Whisper Streaming:实时语音转文本的高效解决方案
探索Whisper Streaming:实时语音转文本的高效解决方案 项目地址:https://gitcode.com/ufal/whisper_streaming Whisper Streaming 是一个强大的开源项目,由捷克布尔诺科技大学UF...
-
diffusers flask streamlit或gradio 简洁可视化AIGC文生图页面
参考: https://python-bloggers.com/2022/12/stable-diffusion-application-with-streamlit/ https://github.com/LowinLi/stable-diffusion...
-
Stable Diffusion 详细教程
Stable Diffusion是一个概念上类似于Diffusion Models的技术,特别是在生成图像和处理自然语言任务方面。然而,“Stable Diffusion”并不是一个直接对应的具体项目或库名称,如DDPM(Denoising Diffusi...
-
Stable Diffusion 安装指南附带安装包
安装Stable Diffusion指南 Stable Diffusion是一款开源、免费的应用程序,这意味着任何人都可以免费、不受限制地利用它进行AI绘画生成操作。其生态系统开放且在不同时期迅速发展。因此,安装和配置方式可能会随着时间推移而发生变化。随...
-
AI绘画SD图片高清化+面部修复+一键抠图,一些你不知道的事儿
说到后期处理板块,大家第一印象就是图像放大,快速且高效。但是今天要讲的后期处理当中,肯定还有一些是你不知道的事儿。 # 放大算法 首先是关于放大算法,如果大家用的都是秋叶大佬的整合包的话,算法总共应该就是这些。常用的就是“R-ESRGAN 4x+”...
-
超详细!AI 绘画神器 Stable Diffusion 基础教程_stable diffusion ai怎么用
HED 边缘检测 跟 Canny 类似,但自由发挥程度更高。HED 边界保留了输入图像中的细节,绘制的人物明暗对比明显,轮廓感更强,适合在保持原来构图的基础上对画面风格进行改变时使用。 Scribble 黑白稿提取 涂鸦成图,比 HED 和 Ca...