-
本地搭建 Whisper 语音识别模型实现实时语音识别研究
目录 摘要 关键词 1. 引言 2. Whisper 模型简介 3. 环境准备 4. 系统架构与实现 4.1 模型加载 4.2 实时音频输入处理 4.3 实时转录处理 4.4 程序实现的框架 4.5 代码实现 5. 实验与结果 6...
-
(不用互三)AI绘画工具大比拼:Midjourney VS Stable Diffusion该如何选择?
文章目录 ?如何选择合适的AI绘画工具 根据个人需求选择 1. 您喜欢什么风格的绘画? 2. 您想要创作什么主题的内容? 3. 您对绘画工具的使用经验如何? 比较工具特点 1. 工具的易用性和功能性如何? 易用性: 功能性: 2....
-
分享3个PPT压缩工具,一键把PPT压缩到10M以内!
在当今数字化办公的时代,PowerPoint (PPT 已成为职场中不可或缺的演示工具。然而,随着PPT插入的文件、嵌入的字体的增加,PPT文件的大小也随之增加,这往往给PPT文件传输和分享带来了不小的挑战。如何在保证PPT质量的同时,将文件大小压缩到可接...
-
心理健康问答系统-AIGC大模型-小程序制作
制作一个心理健康问答系统的小程序,涉及到多个环节和技术领域。这里将从需求分析、技术选型、开发流程、API调用等方面进行详细说明。 一、需求分析与规划 在开始任何项目之前,首先需要明确的是你的小程序想要解决什么样的问题,提供哪些功能给用户。对于心理健康...
-
新手必看!目前最强的AI绘画5款 Flux 实用基础工作流(附资源包)
大家好,我是程序员晓晓 之前为大家梳理了 Flux 开源模型的一些简单用法,今天我们继续了解一些 Flux 基础工作流,如图生图、高清放大、局部重绘等相关用法。最强AI绘画大模型 Flux【基础篇】:ComfyUI Flux.1工作流的本地部署安装教程...
-
探索语言的极限:高效运行LLaMA模型的开源宝藏 —— llama_infer
探索语言的极限:高效运行LLaMA模型的开源宝藏 —— llama_infer llama_inferInference script for Meta's LLaMA models using Hugging Face wrapper项目地址:htt...
-
使用llama-factory和llama.cpp微调量化Qwen2
使用llama-factory和llama.cpp微调量化Qwen2 准备数据集 微调 测试 合并 使用llama.cpp量化 准备数据集 1.选定数据集的格式 2.将处理好的数据集上传到/data 文件夹下面,并修改datase...
-
LyCORIS: 一种革命性的Stable Diffusion微调方法
LyCORIS简介 LyCORIS(Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion 是一个为Stable Diff...
-
ACL 2024 | CoCA:自注意力的缺陷与改进
近年来,在大语言模型(LLM)的反复刷屏过程中,作为其内核的 Transformer 始终是绝对的主角。然而,随着业务落地的诉求逐渐强烈,有些原本不被过多关注的特性,也开始成为焦点。例如:在 Transformer 诞生之初,被视为天然具备的长度外推能力,...
-
简洁实用的原创度检测工具AntiPlagiarism NET 4.132
AntiPlagiarism NET是一个适用于Windows的程序,它允许您检查文本的唯一性和从不同Internet来源借用的存在。使用AntiPlagiarism NET,您可以: 将程序用于不同的目的该程序适用于学生、教师、记者、文案作者和...
-
FLUX 1 将像 Stable Diffusion 一样完整支持ControlNet组件
之前 InstantX 团队做的多合一的 Flux ControlNet 现在开始和 ShakkerAI 合作并推出了:Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro 该模型支持 7 种控制模式,包括 canny...
-
刚刚,英特尔发布最强CPU,AI PC迎来最高效x86芯片
最高效的x86芯片,应当是一种怎样的“打开方式”? 就在刚刚,英特尔给出了一份答案—— 英特尔®酷睿™Ultra200V系列处理器。 话不多说,直接上亮点: 最快的CPU:E核比上一代快68%,P核则快了14% 最快的内置(built-in)GPU:首次...
-
Distil-Whisper:高效快速的语音识别模型
Distil-Whisper:高效快速的语音识别模型 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1...
-
Stable diffusion: AttributeError: module ‘jax.random‘ has no attribute ‘KeyArray‘
错误提示 安装from diffusers import StableDiffusionPipeline 提示错误 AttributeError: module ‘jax.random’ has no attribute ‘KeyArray’...
-
橙芯创想:香橙派AIPRO解锁升腾LLM与Stable Diffusion的创意密码
文章目录 引言 一. 香橙派AI PRO配置以及展示 优秀的扩展能力 实物展示 二、Ascend-LLM模型部署 开机 xshell连接香橙派 实战运行部署 运行结果分析 开发版表现 三、Stable Diffusion 文生图 性能...
-
StableDiffusion设计师必备模型推荐系列(附模型)
前两天,我分享了SDXL的通用模型,这些模型不仅在生成高质量图像和艺术作品方面表现出色,搭配上LoRA模型还能在多个领域发挥重要作用,尤其是在平面设计与UI设计领域。今天,我们就以平面设计师和UI设计师的工作场景为例,探讨Stable Diffusion在...
-
4060显卡+LLaMA-Factory微调LLM环境准备——(一)安装cuda
本地配置 系统:win10**硬件:**i5-12490f+RTX4060 安装原因: 最近尝试在本地对开源LLM进行Fine-tune的时候,用到了LLaMA-Factory,在运行的时候,弹出未检测到GPU,后来才发现,是忘记安装cuda等...
-
FLUX.1 WebUI本地整合包,基于nf4轻量化模型的Stable Difussion WebUI Forge,6G显存可玩
前几天分享了基于SwarmUI的FLUX.1整合包,有人反馈可控参数太少,近几天正好看到了张吕敏大佬的Stable Diffusion WebUI Forge更新了,如果不熟悉WebUI Forge,后期我再跟新一篇文章详细介绍下,这里简单说下,玩AI绘画...
-
WhisperS2T:加速语音转文本的高效解决方案
WhisperS2T:加速语音转文本的高效解决方案 WhisperS2TAn Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference E...
-
【AI绘画】分享个人 AI 绘画心得:Stable diffusion 入门引导教程
大家好,我是设计师子衿。 最近网络上已经有许多朋友都开始自己动手AI绘画,但是又不知道如何入手。在这里我稍微给大家引导入门。 一、AI绘图电脑配置 搞AI绘图,首先是要看自己的电脑配置,如果是配置太低的电脑就不建议玩AI绘图了。 Stable Di...
-
rfid卡频率 ai写作
RFID卡频率:解锁不同场景下的智能识别奥秘 在物联网与数字化技术飞速发展的今天,RFID(无线射频识别)卡作为重要的身份识别与数据追踪工具,其性能与应用广泛受到关注。而RFID卡的频率,作为影响其识别距离、速度、穿透力及安全性的关键因素,更是值得我...
-
码住这款图片处理神器!一键搞定图片尺寸修改,效率翻倍!
Hey,设计界的小伙伴们!你是否还在为不同平台的图片尺寸要求而烦恼?证件照、产品图、社交媒体配图...尺寸不一,手动修改简直让人头大。别急,今天我要分享一个超给力的免费工具—千鹿设计助手,让你的图片处理工作变得轻松又高效! 功能优势: 1. 一键批量改...
-
Stable Diffusion WebUI 1.10.0来了
大家好,我是每天分享AI应用的萤火君! 前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:...
-
秋叶V4.9整合包发布!什么是Stable Diffusion?如何安装Stable Diffusion?
Stable Diffusion秋叶整合包,一键安装Stable Diffusion,门槛极低,完全免费,支持Nvidia全系列显卡。 来自B站up主秋葉aaaki近期推出的Stable Diffusion整合包v4.9版本,能够让零基础用户轻松在本地部...
-
ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货)
原文链接: ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货) (chinaz.com Instant ID 是 controlnet 比较新的一个模型,主要作用也是固定人物的面部特征。它可以仅通过一张图片进行完美换脸,可能是...
-
健身p图AI增肌特效软件GigaBody免费吗?app免费下载安装地址入口使用教程
GigaBody 是什么? GigaBody是一个利用人工智能技术为健身教练、健身房和健身爱好者提供服务的应用程序。它通过用户上传照片,快速预览健身后的效果,从而激发信心和动力。GigaBody已经成为健身领域的热门选择,获得了超过40000+用户的信任...
-
Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1
一. 基础知识 1.1 文生图发展历史 1.2 文生图基础知识 文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。 1.2.1 文生图流程图 1. 输入提示词 ...
-
【已解决】报错“copying a param with shape torch.Size([1280, 1280]) from checkpoint”
在使用SDXL时,报错“copying a param with shape torch.Size([1280, 1280] from checkpoint, the shape in current model is torch.Size([1280,...
-
PS的stable diffusion插件安装指南
PS的stable diffusion插件安装指南 1.首先要安装stable diffusion,具体安装方法,参考https://blog.csdn.net/sheji888/article/details/139196688 stable di...
-
rfid生产应用 智能写作
RFID生产应用:重塑生产流程与效率的深度剖析 在智能制造与工业4.0的浪潮中,RFID(无线射频识别)技术作为物联网的重要组成部分,正逐步渗透到生产领域的每一个角落,以其独特的优势重塑着生产流程与效率。本文将从独特的视角出发,深入探讨RFID技术在...
-
LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141028040 免责声明:本文来源于个人知识与公开资料,仅用于学术交...
-
Stable Diffusion WebUI v1.10.0重大更新,支持SD3!
前言 Hello,大家好!前不久,SDWebUI的作者AUTOMATIC1111终于把它更新到了v1.10.0,这次不仅修复以往的一些BUG,提升了一些性能,这次还支持了SD3_medium.safetensors模型以及SD3_LoRA模型,同时还支...
-
【愚公系列】《微信小程序开发解析》013-基础API
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
【大模型Stable Diffusion】pip安装bitsandbytes后训练报错CUDA Setup failed despite GPU being available
系统环境 GPU: 3060 CUDA:11.6(确保CUDA、cuDNN已安装且添加好环境变量) 操作系统:Win11(Linux的朋友可以参考文末的Issues,再结合GPT相信可以解决的) 问题描述 错误:CUDA Setup fai...
-
FLUX.1最强AI绘画开源新模型,本地部署教程!
原文链接:FLUX.1最强AI绘画开源新模型,本地部署教程! (chinaz.com Flux最近收到了很多模型爱好者的好评,出图质量超越SD3和MJ,许多人说Flux才是大家心目中的SD3,所以我也是非常好奇FLux的实力在这里把本地部署的过程分享给...
-
【人工智能】如何选择AI绘画工具?Midjourney VS Stable Diffusion
文章目录 ?如何选择合适的AI绘画工具 个人需求选择 比较工具特点 社区和资源</font> ? Midjourney VS Stable Diffusion:深度对比与剖析 使用费用对比 使用便捷性与系统兼容性对比 开源与闭...
-
「AIGC」Stable Diffusion教程详解
入门教程提供了Stable Diffusion的基本使用方法。对于更高级的功能,如插件使用、模型部署等,可以在掌握基础操作后进一步学习。 一、Stable Diffusion教程 Stable Diffusion是一款基于人工智能技术开发的绘画软...
-
玩Stable Diffusion不可不知的5款真人模型!大佬都在用!(附模型包)
模型对于AI绘画起决定性作用,今天推荐5款超好用的Stable Diffusion模型。 这些模型都在市面上收获了各种好评,而且各具特色,能满足你对写实人像的各种要求。 1、MajicMIX realisric 麦橘写实 写实系的人像大模型,具有...
-
stable diffusion 模型和lora融合
炜哥的AI学习笔记——SuperMerger插件学习 - 哔哩哔哩接下来学习的插件名字叫做 SuperMerger,它的作用正如其名,可以融合大模型或者 LoRA,一般来说会结合之前的插件 LoRA Block Weight 使用,在调整完成 LoRA 模...
-
使用go-llama.cpp 运行 yi-01-6b大模型,使用本地CPU运行,速度挺快的
1,视频地址 2,关于llama.cpp 项目 https://github.com/ggerganov/llama.cpp LaMA.cpp 项目是开发者 Georgi Gerganov 基于 Meta 释出的 LLaMA 模型(简易 Pyth...
-
stable diffusion学习指南
参考教程 元素同典:元素同典:确实不完全科学的魔导书 stable diffusion 入门:腾讯文档 文生图界面参数设置 prompt 权重 AI 对于关键词的辨识以从前到后为顺序,以逗号为分割。距离较近的词的确更容易产生关联、进行叠加,而更...
-
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序 在人工智能领域中,语音识别技术日益成为核心组成部分,尤其是在实时翻译、字幕制作和无障碍沟通等方面。OpenAI 的 Whisper 模型以及其优化版本 Faster-...
-
2024年Stable Diffusion下载+安装+使用教程(超详细版本)收藏这一篇就够了!
本篇咱们要聊的是如何用“整合包”来搞定StabIe Diffusion WebUI的本地安装和使用,别担心,你不需要成为计算机大神,新手也能轻松上手。不过得提醒一下,你的硬盘得留出100G~200G的空间来,才能玩得转。 整合包放这里,添加领取哦。 咱...
-
项目实训:python whisper安装运行 实现语音识别技术
1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...
-
小文件写入性能 5 倍于 S3FS,JuiceFS 加速生信研究
在生物信息学研究领域,NextFlow 是一款主流数据分析工具,广泛应用于多种研究项目。MemVerge,内存融合基础架构厂商,其公有云计算平台产品 Memory Machine Cloud (MMCloud 无缝集成了 NextFlow,为生物信息学家...
-
快速微调 Whisper 模型:LoRA 加速版
快速微调 Whisper 模型:LoRA 加速版 简述 在当今的AI世界中,模型的大小和复杂性已成为性能的关键驱动力。然而,这也带来了新的挑战:如何在有限的资源下对大型模型进行有效且高效的微调?现在,借助开源项目——Faster Whisper Fine...
-
Windows下安装LLama-Factory
在进行安装前,请先确认你的GPU能支撑起训练的显存。如果和可怜的我一样是4GB可以选择上云或者换一个好一点的显卡。并且确定你安装了显卡驱动版本在官方给的版本以上,如果没有安装,详细参考我的另一篇文章:LLama-Factory运行异常,CU...
-
爬虫 — 自动化爬虫 Selenium
目录 一、介绍 二、对比 三、安装 四、简单使用 五、定位元素 1、By.ID 2、By.CLASS_NAME 3、By.NAME 4、By.TAG_NAM 5、By.XPATH 六、操作元素 1、在输入框输入内容并搜索 2、...
-
每日AIGC最新进展(30):阿卜杜拉国王大学提出旋转视角视频生成Vivid-ZOO、浙江大学提出4D场景编辑Instruct 4D-to-4D、西安交大提出3D重建大规模数据集OpenMateria
Diffusion Models专栏文章汇总:入门与实战 Vivid-ZOO: Multi-View Video Generation with Diffusion Model 本文提出了一种名为Vivid-ZOO的新型扩散模型,用于从文本...
-
Stable Diffusion 使用
目录 背景 最简单用法 进阶用法 高手用法 safetensor 一、概述 二、主要特点 背景 Stable Diffusion 开源后,确实比较火,上次介绍了下 Stable Diffusion 最简单的concept。今天继续介...