-
Stable Diffusion整合包与手动本地部署结合内网穿透远程AI绘画
文章目录 前言 1. 本地部署Stable Diffusion Web UI 1.1 整合包安装 1.2 手动安装Stable Diffusion Web UI 2. 安装Cpolar内网穿透 3. 实现公网访问Stable Diffusi...
-
快速体验LoRA微调Llama3-8B模型以及海光DCU推理加速(曙光超算互联网平台国产异构加速卡)
序言 本文以 LLaMA-Factory 为例,在超算互联网平台SCNet上使用异构加速卡AI 显存64GB PCIE,对 Llama3-8B-Instruct 模型进行 LoRA 微调、合并和推理。 一、参考资料 github仓库代码:LLaM...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶 笔记
在夏令营第四期Task1时,我们已经跑通了baseline,本期目的是对baseline的代码有一个更加细致的理解,学习如何借助AI来提升我们的自学习能力,理解每行代码的意思,从大模型提问技巧来实现自主学习,并学习如何制作一个连环画。 首先认识大语言模型...
-
Dreambooth-Stable-Diffusion 使用教程
Dreambooth-Stable-Diffusion 使用教程 Dreambooth-Stable-DiffusionImplementation of Dreambooth (https://arxiv.org/abs/2208.12242 by...
-
WhisperX 安装与使用指南
WhisperX 安装与使用指南 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音识别和语音...
-
基础模型在亚马逊的BEDROCK测试
前 言 通过 Amazon Bedrock,开发者可以轻松使用多种最新领先基础模型(FM)进行构建。本实验中,您将了解和体验到在 Amazon Bedrock 中模型的基础使用方法,以便您快速构建强大安全的大语言模型(LLM)应用,其中包括:...
-
介绍 Whisper 模型
介绍 Whisper 模型 Whisper 是一个通用的语音识别模型。它在大规模多样化的音频数据集上进行训练,并且能够执行多任务处理,包括多语言语音识别、语音翻译和语言识别。 核心方法 Whisper 使用的是 Transformer 序列到序列...
-
使用Python和Pillow创建照片马赛克应用
在这篇博客中,我们将探讨如何使用Python创建一个简单而有趣的桌面应用程序。我们的目标是构建一个应用,允许用户选择一张照片,然后在照片的右下角添加马赛克效果。这个项目将展示如何结合使用wxPython来创建图形用户界面(GUI 和Pillow库来处理图像...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶 Part1:磨刀准备一一认识通义千问 会用ChatGpt就行 Part2:精读baseline——从零入门AI生图 1. 代码的主体架构...
-
阿里开源语音大模型CosyVoice:3秒还原声音,从部署到克隆的完整指南
前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。 我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义实验室在七...
-
Ebsynth Utility 最新出错解决方法,避坑、非整合包玩法安装教程
项目背景,最近BOSS让我追热点,做点AI相关的奥运视频热点。 打开了SD,插件什么的都齐备,但是一执行第一步就跳过,生成了文件夹,但是内容是空的。 前后折磨了快三天了,终于条理清晰的找到了病灶的根源。 谨以此文记录流程,以便日后自己再次需要,也...
-
Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析
Llama 3.1 发布了!Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发,70B 适合大规模 AI 原生应用,而 405B 则适用于合成数据、大语言模型 (LLM 作为评判者或蒸馏。这三个规格都提供基础版和指令调优...
-
Xinference安装及部署大模型
1. Xinference 介绍 Xorbits Inference (Xinference 是一个开源平台,用于简化各种 AI 模型的运行和集成。借助 Xinference,您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理...
-
Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2
目录 认识AI助手——通义千问 操作指南 主要功能模块 精读baseline代码 分析代码的主体架构 逐行解释代码 其他疑问-向AI追问 进行实战——基于话剧的连环画制作 提示词准备 执行Task1的30分钟速通Baseline 修改...
-
stable diffusion+LangChain+LLM自动生成图片
最近都在研究和学习stable diffusion和langchain的相关知识,并且看到stable diffusion也是有类似于ChatGLM的api调用方式,那在想有没有可能将stable diffusion也集成到langchain中来呢?看到网...
-
GOLLIE : ANNOTATION GUIDELINES IMPROVE ZERO-SHOT INFORMATION-EXTRACTION
文章目录 题目 摘要 引言 方法 实验 消融研究 题目 Techgpt-2.0:解决知识图谱构建任务的大型语言模型项目 论文地址:https://arxiv.org/abs/2310.03668 摘要 大...
-
AI绘画大模型-StableDiffusion最强模型sd3(本地安装方法)
前言/introduction Stable Diffusion 3(简称SD3)是Stability AI最新推出的文本到图像生成模型。相比前代模型,SD3在生成质量、细节表现以及运行效率上有了显著提升,尤其在细腻的图像渲染和复杂...
-
使用Faster Whisper:提升你的音频处理效率和质量
使用Faster Whisper:提升你的音频处理效率和质量 faster-whisper项目地址:https://gitcode.com/gh_mirrors/fas/faster-whisper 该项目,,是一个开源的Python库,专为优化对...
-
AIGC: 5 IT从业者如何使用AI赋能业务?
上图是一个使用AI生成的图片, 描述一下这篇文章的背景。 程序员系统学习了OpenAI提供的api接口,并熟练利用提示词结合业务解决业务问题。 现状 讲一个故事来开始今天的内容。 架构师老李在技术圈里以其卓越的技术洞察力而著称。另一边,Carter...
-
如何在本地运行Llama 3系列:完整指南
今天咱们来聊聊 AI 界的重要事情——那些像 Llama3 系列这样的超大型语言模型(LLMs),现在居然可以在咱们自己的地盘上运行啦!想象一下,这就像是把一个超级智能的助手请进了家门,而且还是私密的,不用担心信息泄露的问题。 本文,虽然是基于之前 Ll...
-
Datawhale Al夏令营 AIGC方向 task2
1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...
-
本地部署,Whisper: 开源语音识别模型
目录 简介 特点 应用 使用方法 总结 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Reco...
-
Stable Diffusion WebUI 1.10.0来了
大家好,我是每天分享AI应用的萤火君! 前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:...
-
使用llama factory对语言模型微调,重塑自我认知,并部署于ollama上
本文记录了从环境部署到微调模型、效果测试并部署的全过程。 一 环境 如果使用autodl租赁服务器则不需要如下步骤,但是请注意llama_factory需要python、cuda等版本满足: 首先请确报你已经安装好了conda工具...
-
Python虚拟环境:使用venv隔离项目依赖
前言 在开发Python项目时,管理项目的依赖关系是一个常见的挑战。不同项目可能需要不同版本的库,如果不加以管理,很容易导致依赖冲突和环境混乱。幸运的是,Python提供了虚拟环境(virtual environment)的解决方案,帮助我们隔离项目依...
-
秋叶V4.9整合包发布!什么是Stable Diffusion?如何安装Stable Diffusion?
Stable Diffusion秋叶整合包,一键安装Stable Diffusion,门槛极低,完全免费,支持Nvidia全系列显卡。 来自B站up主秋葉aaaki近期推出的Stable Diffusion整合包v4.9版本,能够让零基础用户轻松在本地部...
-
Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记
大纲 一、前言 二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成(图片及对应标签) 2.4 设置data-juicer 配置文件并执行,处理metadata.jsonl文件生成result....
-
知识图谱大模型系列之 17 使用 Llamaindex、Neo4j 和 Llama 3 构建具有知识图谱的高级 RAG 聊天机器人(教程含源码)
简介 通过集成知识图谱来构建高级检索增强生成 (RAG 聊天机器人的分步指南。在检索增强生成 (RAG 解决方案中集成知识图谱可通过提供结构化和关系上下文显著提高响应的相关性和深度。知识图谱在 RAG 解决方案中非常有用,例如在医疗保健领域。例如,...
-
【愚公系列】《AIGC辅助软件开发》007-面向软件开发的提示工程:写Prompt就是逐步明确需求的过程
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
重磅!微软 Build 2024 开发者大会宣布 Team Copilot 年内推出预览版
点击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 AI要逆天了! 以前是一直在模仿,从未被超越 这次微软终于放大招了 就在昨夜,微软昨夜AI全家桶狂飙:一口气宣布了50多项AI能力更新,覆盖...
-
【愚公系列】《AIGC辅助软件开发》011-AI辅助编写技术文档:技术文档
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
ComfyUI教程一:安装使用前的准备
前言 ComfyUI的用户越来越多,老李也接触了很多初学者,他们希望老李能在开始培训前讲一些相关基础知识,所以我就把自己之前的经验总结一下,方便刚刚接触comfyUI的同学学习。 今天我把comfyUI需要的几个基础软件给大家讲一下,主要面向的是普通...
-
Datawhale X 魔搭 AI夏令营---AIGC Task2
目录 Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向 Task2:精读代码,实战进阶 0.0 一些link 0.1 任务内容 0.2 AI生图 0.3 **Kolors(可图)模型** 1.1 精读baseline——从...
-
运行Llama 2于本地CPU上的开源LLM推理指南
运行Llama 2于本地CPU上的开源LLM推理指南 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on CPU Inference Lo...
-
微调大语言模型——LLaMa-Factory平台搭建(非常详细)零基础入门到精通,收藏这一篇就够了
我们采用 LLaMA-Factory平台进行微调语言模型,详细信息可以访问github主页(https://github.com/hiyouga/LLaMA-Factory)浏览。 租赁显卡 采用AutoDL作为云平台进行微调训练。Win系统采用终端...
-
阿里通义千问大模型Qwen2-72B-Instruct通用能力登顶国内第一!
前言: 中国互联网协会副秘书长裴玮近日在2024中国互联网大会上发布《中国互联网发展报告(2024 》。《报告》指出, 在人工智能领域,2023年我国人工智能产业应用进程持续推进,核心产业规模达到5784亿元。 截至2024年3月,我国人工智能企业数...
-
【史上最强的AIGC的使用场景和具体案例分析】
AIGC(Artificial Intelligence in Game Creation)是一种利用人工智能技术辅助游戏开发的方法。它可以用于游戏中的各个方面,包括游戏设计、关卡设计、角色设计、AI行为设计等。 以下是一些AIGC的使用场景和具体案例...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task02笔记
一、探探前沿:了解一下 AI生图技术 的能力&局限 1. 为什么要了解AI生图前沿? AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 学习笔记(一)
本期主要任务是了解AI文生图的原理并进行相关实践 下面是对baseline部分代码的功能介绍: 安装Data-juicere和DiffSynth-Studio !pip install simple-aesthetics-predictor !pip...
-
深入剖析大模型安全问题:Langchain框架的隐藏风险
随着大模型热度持续,基于大模型的各类应用层出不穷。Langchain 作为一个以 LLM 模型为核心的开发框架,可以帮助我们灵活地创建各类应用,同时也为大模型的应用引入新的安全隐患。从今年 4 月 Langchain 被爆出在野 0day 漏洞开始,各类安...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task02笔记
1:精读baseline 这里我使用了ChatGPT 4o对吧baseline文件代码进行了解析(不知道为啥我的通义千问无法使用 。 GPT代码解析结果如下: 1. 环境设置与依赖安装 !pip install simple-aest...
-
magic-animate_pytorch AIGC使图像中人物按照给定动作动起来
magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...
-
【Qwen2部署实战】探索Qwen2-7B:通过FastApi框架实现API的部署与调用
系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
多语言声音克隆,CosyVoice模型最强部署
CosyVoice是由阿里通义实验室开源的一款多语言语音理解模型,它主要聚焦于高质量的语音合成,能够生成自然且逼真的语音。 CosyVoice模型经过超过15万小时的数据训练,支持中文、英语、日语、粤语和韩语多种语言的合成,且在多语言语音生成、零样本语音...
-
基于AutoDL的语言大模型入门——Llama2-chat-13B-Chinese
AutoDL界面 ① autodl-tmp文件夹:数据盘,一般用来存放大的文件。 ② 其他文件夹“autodl-pub” “miniconda3” “tf-logs”等等存放在系统盘,其中tf-logs是用于存放训练过程tensorboard的...
-
Datawhale X 魔搭 AI夏令营 “AIGC”方向 task1
一、任务要求 task1 的任务和上一期的类似,都是跑通给出的代码即可,没有太大难度。 具体要求是训练 Lora 模型,实现文生图,额外的要求是8张图片必须组成一个连贯的故事,需要一定的“写小作文”能力。 二、代码解析 下载数据集 这一步不用分析...
-
ComfyUI安装完整攻略
ComfyUI简介 ComfyUI是一种新型的Stable Diffusion用户界面,因其独树一帜的“节点式”界面,逐渐成为了AI绘画领域进阶玩家的得力武器。搭配各式各样的自定义节点与功能强大的工作流,它得以用更低的配置实现许多在WebUI等常规界面里...
-
whisper+speaker.diarization.3.1实现根据说话人转文本
主要目的是复盘一下自己的第一个本地部署的代码。起因是老师布置的任务,想实现一个有关于教育场景的进行语音转录的模型。任务交给了本小白......好吧硬着头皮上,这篇博客也主要是记录自己的遇见的各种问题,以及对一些代码的改进。需要的小伙伴可以借鉴。 一,语音...
-
【Qwen-Audio部署实战】Qwen-Audio-Chat模型之对话机器人部署测试
系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
【LLaMA-Factory】常见报错信息及解决方法整理
1.‘llamafactory-cli’ 不是内部或外部命令,也不是可运行的程序 或批处理文件。 bash: llamafactory-cli: command not found #3568 解决方法: cd 你路径下的\LLaMA-Factor...