-
本地搭建 Whisper 语音识别模型实现实时语音识别研究
目录 摘要 关键词 1. 引言 2. Whisper 模型简介 3. 环境准备 4. 系统架构与实现 4.1 模型加载 4.2 实时音频输入处理 4.3 实时转录处理 4.4 程序实现的框架 4.5 代码实现 5. 实验与结果 6...
-
audioWhisper 项目使用教程
audioWhisper 项目使用教程 audioWhisperListen to any audio stream on your machine and print out the transcribed or translated audio.项...
-
Ollama保姆级教程
Ollama保姆级教程 Ollama是一个开源框架,专门设计用于在本地运行大型语言模型。它的主要特点是将模型权重、配置和数据捆绑到一个包中,从而优化了设置和配置细节,包括GPU使用情况,简化了在本地运行大型模型的过程。 Ollama还提供了对模型量化...
-
Midjourney自动化机器人使用教程
Midjourney自动化机器人使用教程 midjourney-automation-botThis repository hosts the Midjourney Automation Bot, a free script leveraging Op...
-
使用Amazon SageMaker JumpStart微调Meta Llama 3.1模型以进行生成式AI推理
文章目录 使用Amazon SageMaker JumpStart微调Meta Llama 3.1模型以进行生成式AI推理 Meta Llama 3.1 SageMaker JumpStart SageMaker JumpStart中Meta...
-
Jetson 部署 Faster Whisper
文章目录 Whisper Faster Whisper 安装使用 尝试WSL部署 尝试 Jetson 部署 时间戳 实时转录 Whisper Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一...
-
StableDiffusion(SD)文生图教程
参数详解 ?提示词词输入(Prompt) SD中的关键词分为正面提示词和负面提示词。 正面提示词(Prompt) 将想要的图像进行描述,描述的越详细,越能达到你想要的效果;描述的越少,越由AI随意发挥,更加有创意性。 负面提示词(Negative Pro...
-
探索Meta新发布的大模型:Llama 3.1
最近正好关注到了meta发布的新大模型llama3.1,于是抱着好奇的态度来试一下。 近期,Meta发布了其最新的大模型——Llama 3.1。作为一名科技爱好者和人工智能的追随者,我迫不及待地想要了解这一新模型的性能和特点。本文将带你一起探索Llama...
-
stable diffusion的AnimateDiff动画插件
AnimateDiff简介 Stable Diffusion的AnimateDiff插件是一个用于生成和操作图像的强大工具,它属于Stable Diffusion模型的一个扩展。 1. 功能和用途 图像生成与修改: AnimateDiff插件能够...
-
免费体验!快速生成超逼真真人美图的Stable Diffusion模型!
环境安装 1、安装Python 下载地址:https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe。 备注:把安装目录加入环境变量! 2、安装git 下载地址:h...
-
Whisper Web 开源项目教程
Whisper Web 开源项目教程 whisper-webML-powered speech recognition directly in your browser项目地址:https://gitcode.com/gh_mirrors/wh/whi...
-
使用WhisperLive实现实时语音转文本的魅力
使用WhisperLive实现实时语音转文本的魅力 WhisperLiveA nearly-live implementation of OpenAI's Whisper.项目地址:https://gitcode.com/gh_mirrors/wh/W...
-
AIGC实践——asr识别FunASR手把手部署流程
? 大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、互联网和自媒体。 FunASR是什么? FunASR 是一个基本的语音识别工具包,提供多种功能,包括语音识别 (ASR 、语音活动检测 (VAD 、标点符号恢复、语言模型...
-
推荐项目:Config-Presets - 让Stable Diffusion Web UI的创造力倍增!
推荐项目:Config-Presets - 让Stable Diffusion Web UI的创造力倍增! Config-PresetsExtension for Automatic1111项目地址:https://gitcode.com/gh_mir...
-
Cog-Stable-Diffusion 开源项目指南
Cog-Stable-Diffusion 开源项目指南 cog-stable-diffusionDiffusers Stable Diffusion as a Cog model项目地址:https://gitcode.com/gh_mirrors/c...
-
AI绘画SD中,如何保持生成人物角色脸部一致?Stable Diffusion精准控制AI人像一致性两种实用方法教程!
大家好,程序员晓晓 在AI绘画StableDiffusion中,一直都有一个比较困难的问题,就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践,大家和我一起来看看吧。 一. 有哪些实现方式 方式1:固定Seed种子值。 固定Seed种...
-
开源项目教程:Llama
开源项目教程:Llama llama项目地址:https://gitcode.com/gh_mirrors/llam/llama 项目介绍 此教程基于GitHub上的开源项目 nelhage/llama,不过请注意,上述提供的链接并非真实的项目地...
-
GitHub Copilot使用
本文会用更通俗的语言,并提供更全面的用例和具体操作步骤,帮助你更好地使用 Copilot 进行代码编写和优化。 **GitHub Copilot ** GitHub Copilot 是一款强大的 AI 辅助编程工具,通过编写提示词(Prompt)可以...
-
大模型_基于医疗领域用lora微调医疗数据及LLaMA微调ChatDoctor模型
文章目录 ChatDoctor 目标 方法 结果 结论 收集和准备医患对话数据集 创建外部知识数据库 具有知识大脑的自主聊天医生的开发 模型培训 结果 数据和模型: 微调 推理 ChatDoctor 目标 这项研究的主要...
-
Copilot新版界面体验教程(20240607)
一、Copilot简介 微软 Copilot 是一款由微软推出的日常 AI 助手,它整合了微软多个产品中的 AI 功能,如 GitHub、Microsoft 365、Bing 和 Edge,提供一个统一的体验。Copilot 能够根据网络上的上下文、工作...
-
探索未来编程:掌握GitHub Copilot的奥秘
探索未来编程:掌握GitHub Copilot的奥秘 Mastering-GitHub-Copilot-for-Paired-ProgrammingA 6 Lesson course teaching everything you need to kn...
-
DatawhaleX魔搭-AI夏令营AIGC-task2
一、了解AI生图技术 1,为什么了解生图技术 AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。 应用广泛...
-
【AI绘画】ComfyUI Flux:你必须要掌握的Flux Controlnet,商业闭环就靠它了
大家好,我是爱绘画的彤姐。 目前Flux开始支持Controlent了,这个一定要掌握,今天就来带大家学习Flux中Controlnet的使用。 一、介绍 今天继续来分享Flux生态里面一个很重要插件,就是Controlnet,我们都知道Contr...
-
GoAmzAI-全新的AIGC应用、AI系统程序,授权私有化部署 - 基于 Golang + Vue 的全新的个人、团队、企业私有化、运营的AIGC系统应用功能介绍
功能概览 极速部署,宝塔5分钟部署完成,低内存高并发,内存占用不到100MB! 配置简单快捷,配置文件仅需数据库配置即可启动 强大的在线配置框架及丝滑版的体验,95%数据都可以后台在线统一管理! 完美的自适应,支持手机、平板、电脑等多种尺寸设备的浏览...
-
llamafactory-llama3微调中文数据集
一、定义 https://github.com/SmartFlowAI/Llama3-Tutorial/tree/main 基准模型测试 opencompass 离线测评 数据准备 微调训练 合并 测试 人工审核对比 二、实现 基准模型测试...
-
探索和构建 LLaMA 3 架构:深入探究组件、编码和推理技术
Meta 正在加大在人工智能 (AI 竞赛中的力度,推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持,现已在所有 Meta 平台上可用。 以下是您需要了解的有关 Meta 最新大型语言模...
-
在Ubuntu22.04 使用stable-diffusion-webui 秋叶整合包
背景 众所周知,赛博菩萨已经发布了windows下的整合包,开箱即用,且集成度较高。 那我为啥非要在Ubuntu下使用呢? 当然是因为主力机就是Ubuntu系统啦。而且涉及到sd webui API 的调用,在Ubuntu 下调试更加方便一点。 那有...
-
如何系统学习AIGC(人工智能生成内容):适合普通人的入门指南
随着人工智能技术的迅猛发展,AIGC(人工智能生成内容)已成为一大热点。对于非软件技术专业的普通人来说,如何系统地学习AIGC,了解底层知识结构、掌握常见工具用法,是一个非常实际的问题。本文将为大家推荐一些优质的中文学习资料和方法,帮助大家更好地入门AIG...
-
集成 Sermant,ServiceStage 带你实现应用上下线平滑过渡
摘要:为了保证应用正确上下线、流量不丢失,ServiceStage 基于 Sermant 提供了一套优雅上下线的方案,包括预热、延迟下线等,避免了请求超时、连接拒绝、流量丢失等问题的发生。 本文分享自华为云社区《ServiceStage 集成 Ser...
-
9、LLaMA-Factory项目微调介绍
1、LLaMA Factory 介绍 LLaMA Factory是一个在GitHub上开源的项目,该项目给自身的定位是:提供一个易于使用的大语言模型(LLM)微调框架,支持LLaMA、Baichuan、Qwen、ChatGLM等架构的大模型。更细致...
-
Faster Whisper 使用教程
Faster Whisper 使用教程 faster-whisper项目地址:https://gitcode.com/gh_mirrors/fas/faster-whisper 项目介绍 Faster Whisper 是一个基于 CTransla...
-
OpenAI Whisper 开源项目使用手册
OpenAI Whisper 开源项目使用手册 openai-whisperA sample web app using OpenAI Whisper to transcribe audio built on Next.js. It records a...
-
Whisper-Dictation:基于OpenAI语音转文本模型的开源录音转文字应用
Whisper-Dictation:基于OpenAI语音转文本模型的开源录音转文字应用 whisper_dictation Fast! Offline, privacy-focused, hands-free voice typing, 2-way...
-
探索语言的极限:高效运行LLaMA模型的开源宝藏 —— llama_infer
探索语言的极限:高效运行LLaMA模型的开源宝藏 —— llama_infer llama_inferInference script for Meta's LLaMA models using Hugging Face wrapper项目地址:htt...
-
本地服务器部署Text generation并添加code llama实现远程多人协作
文章目录 前言 1. 本地部署Text generation Web UI 2. 安装CodeLlama大模型 3. 实现公网远程使用Code Llama 4. 固定Text generation Web UI公网地址 前言 本篇...
-
清华系公司强强联合,一张4090让安全大模型进入千亿时代|长亭x趋境
AI大行其道的时代,网络安全正面临前所未有的威胁。 化身黑客的AI学会了自动化攻击,还有相当高的成功率,伊利诺伊大学香槟分校研究团队的最新研究显示:GPT-4能够在阅读CVE漏洞描述后,学会利用漏洞攻击,成功率高达87%。 既然攻击方都与时俱进,用上AI新...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task03笔记
在task02中,我们对baseline有了深度了解,我们学会了用AI工具来帮助我们学习。另外,我们制作了话剧连环画。 我们今天的任务是了解微调的基本原理,然后我们会对微调的各种参数有一个更加清楚的了解,来实现一个更好的效果,并且在这个Task中会给大家...
-
无需训练的 Diffusion MoE 方案 (SegMoE): Segmind Mixture of Diffusion Experts
Paper name SegMoE: Segmind Mixture of Diffusion Experts Paper Reading Note Blog URL: https://blog.segmind.com/introducing-seg...
-
5分钟 Stable Diffusion本地安装
要在5分钟内完成Stable Diffusion的本地安装,可以参考以下步骤: 下载安装包:首先,需要下载Stable Diffusion的一键部署包。可以从多个资源网站或教程中找到下载链接,例如秋叶整合包。 解压安装包:下载完成后,解压安装包。...
-
【AIGC半月报】AIGC大模型启元:2024.08(下)
【AIGC半月报】AIGC大模型启元:2024.08(下)) (1 Nemotron-4-Minitron(Nvidia LLM) (2 VITA(腾讯优图多模态大模型) (3 mPLUG-Owl3(阿里巴巴多模态大模型) (4 ADA...
-
llama-node 项目教程
llama-node 项目教程 llama-nodeBelieve in AI democratization. llama for nodejs backed by llama-rs, llama.cpp and rwkv.cpp, work loc...
-
推荐项目:Honest LLaMA——追求真相的大型语言模型干预技术
推荐项目:Honest LLaMA——追求真相的大型语言模型干预技术 honest_llamaInference-Time Intervention: Eliciting Truthful Answers from a Language Model项目...
-
Flux【基础篇】:Flux&Midjourney&SDXL模型出图对比:细节质量
大家好我是极客菌!!! 前面和大家分享了Flux在手部和脚生成图片的效果。 今天我们看一下Flux在细节质量上面的表现。主要是以下3个模型的对比。 Flux.1 Dev Midjourney V6.1 SD大模型:RealVisXL V4...
-
本地部署Llama 3.1大模型
Meta推出的Llama 3.1系列包括80亿、700亿、4050亿参数版本,上下文长度扩展至12.8万tokens,并增加了对八种语言的支持。 部署模型需要用到Ollama的一个工具,访问官方网站https://ollama.com 点击下载...
-
24最新Stable Diffusion 本地部署,超详细教程(手动+自动+整合包三种方式)总有一种适合你!
前言 一、 Stable Diffusion简介 2022年作为AIGC(Artificial Intelligence Generated Content)时代的元年,各个领域的AIGC技术都有一个迅猛的发展,给工业界、学术界、投资界甚至...
-
Unsloth微调环境搭建与LLaMA 3.1-8B模型微调实践指南
本文将详细介绍如何使用Unsloth框架进行LLaMA 3.1-8B模型的微调,帮助您快速构建微调环境,并了解微调流程的基本步骤。本教程适合初学者,旨在帮助您在短时间内实现自己的专属模型微调。对于更复杂的微调参数和细节设置,将在后续文章中进一步阐述。 文...
-
AIGC文生图 ComfyUI介绍与实践+Lora微调-Task3 Datawhale X 魔搭 AI夏令营第四期
目录 概要 ComfyUI介绍 ComfyUI实践 ComfyUI学习资源推荐 Lora微调 Lora数据库推荐 问题解决 说在最后 概要 今天的任务是了解微调的基本原理,然后会对微调的各种参数有一个更加清楚的阐释,来实现...
-
AuraFlow:超越Stable Diffusion 3,开源文生图模型的未来之星
前沿科技速递? 开源创新先锋fal.ai携手社区顶尖开发者,震撼发布AuraFlow v0.1——全球首个完全开源的大型整流流文本到图像生成模型,开启文生图领域新篇章! 极致开源精神:AuraFlow v0.1作为对Stable Diffusion...
-
Stable Diffusion Discord Bot 项目教程
Stable Diffusion Discord Bot 项目教程 stable-diffusion-discord-botA Discord bot, written in Go, that interfaces with the Automatic...
-
llama.cpp本地部署大模型
llama.cpp 是一个C++库,用于简化LLM推理的设置,它使得在本地机器上运行大模型(GGUF格式)成为可能。 官网:https://github.com/ggerganov/llama.cpp 模型库: https://huggingface...