-
WhisperS2T:加速语音转文本的高效解决方案
WhisperS2T:加速语音转文本的高效解决方案 WhisperS2TAn Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference E...
-
AI应用商店是门好生意,可要如何说服开发者入驻?
无论Epic Games、Spotify这种一直与苹果对簿公堂,还是腾讯、抖音这样试图钻相关规则漏洞的公司,对于苹果通过应用内购买(IAP)抽取30%的费用,越来越多的头部开发者开始失去耐心。但就在抱怨“苹果税”的同时,有能力的厂商也在尝试复刻苹果建立的这...
-
Stable Diffusion整合包与手动本地部署结合内网穿透远程AI绘画
文章目录 前言 1. 本地部署Stable Diffusion Web UI 1.1 整合包安装 1.2 手动安装Stable Diffusion Web UI 2. 安装Cpolar内网穿透 3. 实现公网访问Stable Diffusi...
-
Hexo搭建个人博客系列【八】- Butterfly侧边栏公众号
本期将为大家讲解如何在Hexo Butterfly主题的侧边栏显示公众号图片。 0. 前期回顾 最新Hexo+GitHubPages搭建个人博客【一】 最新Hexo+GitHubPages搭建个人博客【二】-使用Vercel加速和自定义域名...
-
快速体验LoRA微调Llama3-8B模型以及海光DCU推理加速(曙光超算互联网平台国产异构加速卡)
序言 本文以 LLaMA-Factory 为例,在超算互联网平台SCNet上使用异构加速卡AI 显存64GB PCIE,对 Llama3-8B-Instruct 模型进行 LoRA 微调、合并和推理。 一、参考资料 github仓库代码:LLaM...
-
探索法律智能的新高度:Lawyer LLaMA 项目深度解析
探索法律智能的新高度:Lawyer LLaMA 项目深度解析 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/la...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶 笔记
在夏令营第四期Task1时,我们已经跑通了baseline,本期目的是对baseline的代码有一个更加细致的理解,学习如何借助AI来提升我们的自学习能力,理解每行代码的意思,从大模型提问技巧来实现自主学习,并学习如何制作一个连环画。 首先认识大语言模型...
-
Datawhale X 魔搭 AI夏令营 - AIGC方向(task01笔记)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、基础知识 二、实现步骤 1.克隆存储库: 2. 安装环境,然后重启kernel 3. 调整prompt 总结 前言 赛题介绍...
-
Dreambooth-Stable-Diffusion 使用教程
Dreambooth-Stable-Diffusion 使用教程 Dreambooth-Stable-DiffusionImplementation of Dreambooth (https://arxiv.org/abs/2208.12242 by...
-
Datawhale AI 夏令营 “AIGC”方向 Task1:从零入门AI生图原理&实践
Task1:从零入门AI生图原理&实践 提示:本文为对平台文档的解读注释和补充 Task1:从零入门AI生图原理&实践 Task1:从零入门AI生图原理&实践 文生图 LoRA 提示词 模型参数解读和测试...
-
Llama改进之——分组查询注意力
引言 今天介绍LLAMA2模型引入的关于注意力的改进——分组查询注意力(Grouped-query attention,GQA 1。 Transformer中的多头注意力在解码阶段来说是一个性能瓶颈。多查询注意力2通过共享单个key和value头,同...
-
WhisperX 安装与使用指南
WhisperX 安装与使用指南 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音识别和语音...
-
一文理解生成式AI应用的五个级别:Tool、Chatbot、Copilot、Agent 和 Intelligence
当下,很多人对 AI 一知半解,并不能很好地区分:Tool、Chatbot、Copilot、Agent 和 Intelligence 概念之间的区别。 最近读完 《真格基金戴雨森谈生成式AI:这是比移动互联网更大的创业机会,开始行动是关键 》 发现讲的特别...
-
树莓派4B部署及测试llamafile
重点:不要用树莓派的官方镜像(至少20240808目前的还不支持llamafile,会报错llamafile: prog mmap failed w/ errno 12),查看llamafile github项目下别人的做法是重新换成Ubuntu serv...
-
介绍 Whisper 模型
介绍 Whisper 模型 Whisper 是一个通用的语音识别模型。它在大规模多样化的音频数据集上进行训练,并且能够执行多任务处理,包括多语言语音识别、语音翻译和语言识别。 核心方法 Whisper 使用的是 Transformer 序列到序列...
-
通过剪枝与知识蒸馏优化大型语言模型:NVIDIA在Llama 3.1模型上的实践与创新
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
Llama-2-Open-Source-LLM-CPU-Inference 使用教程
Llama-2-Open-Source-LLM-CPU-Inference 使用教程 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on...
-
1张Nvidia A100 80G部署Lamma3 70b 4bit的性能测试
这里写自定义目录标题 硬件 部署模型 硬件性能监控工具 GPU监控工具 CPU和系统内存监控工具 部署框架 命令 测试脚本与结果 输出定量token测试 prompt 脚本 Test Result 输入定量token测试 prom...
-
SonarQube前后端代码质量分析实战
X项目backend代码分析 C#(.net7)代码分析 Release 6.0.0 · SonarSource/sonar-scanner-msbuild · GitHub下载sonar-scanner-6.0.0.81631-net.zip,解...
-
LLMs之Llama Coder:llama-coder的简介、安装和使用方法、案例应用之详细攻略
LLMs之Llama Coder:llama-coder的简介、安装和使用方法、案例应用之详细攻略 目录 llama-coder的简介 1、特点 llama-coder的安装和使用方法 1、安装 推荐硬件 本地安装 远程安装 模型...
-
阿里开源语音大模型CosyVoice:3秒还原声音,从部署到克隆的完整指南
前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。 我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义实验室在七...
-
Ebsynth Utility 最新出错解决方法,避坑、非整合包玩法安装教程
项目背景,最近BOSS让我追热点,做点AI相关的奥运视频热点。 打开了SD,插件什么的都齐备,但是一执行第一步就跳过,生成了文件夹,但是内容是空的。 前后折磨了快三天了,终于条理清晰的找到了病灶的根源。 谨以此文记录流程,以便日后自己再次需要,也...
-
comfyUI-MuseTalk用户交互体验的参数设计和设置
comfyUI-MuseTalk用户交互体验的参数设计和设置 目录 comfyUI-MuseTalk的参数设置 一、ComfyUI-VideoHelperSuite 二、comfyUI-MuseV合成的参考视频 2.1、什么时候会用到MuseV?...
-
Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2
目录 认识AI助手——通义千问 操作指南 主要功能模块 精读baseline代码 分析代码的主体架构 逐行解释代码 其他疑问-向AI追问 进行实战——基于话剧的连环画制作 提示词准备 执行Task1的30分钟速通Baseline 修改...
-
Datawhale X 魔搭 AI夏令营 AIGC方向 Task02
参考教程:Docshttps://datawhaler.feishu.cn/wiki/KxI2wIeAJiRQWhkRt9dcqlNVnFR?from=from_copylink 精读baseline 代码整理 使用通义千问辅助理解baseline代...
-
使用Faster Whisper:提升你的音频处理效率和质量
使用Faster Whisper:提升你的音频处理效率和质量 faster-whisper项目地址:https://gitcode.com/gh_mirrors/fas/faster-whisper 该项目,,是一个开源的Python库,专为优化对...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 task02笔记
AI工具使用 1. baseline 代码 2. 使用通义千问理解代码 2.1 工作流程 2.2 逐行释意 3. 使用通义千问生成 Prompt 3.1 生成的 Prompt 3.1 根据 Prompt 生成的图片 1. b...
-
【三维重建】Pixel-GS:三维高斯泼溅的像素感知的梯度密度控制(去除浮点,提升精度)
项目:https://pixelgs.github.io/标题:Pixel-GS: Density Control with Pixel-aware Gradient for 3D Gaussian Splatting来源:香港大学;腾讯AI Lab...
-
Whisper Burn 开源项目教程
Whisper Burn 开源项目教程 whisper-burnA Rust implementation of OpenAI's Whisper model using the burn framework项目地址:https://gitcode.c...
-
【愚公系列】《AIGC辅助软件开发》017-AI辅助后端编程:用ChatGPT写简单的生鲜小超市项目
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
Whisper Android 项目使用教程
Whisper Android 项目使用教程 whisper_androidOffline Speech Recognition with OpenAI Whisper and TensorFlow Lite for Android项目地址:https...
-
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南 stable-diffusion.cppStable Diffusion in pure C/C++项目地址:https://gitcode.com/gh_mirrors/st/...
-
T-Eval:大模型智能体能力评测基准解读 | ACL 2024
AI Agent(智能体)作为大模型的重要应用模式,能够通过使用外部工具来执行复杂任务,完成多步骤的工作流程。为了更全面地评估模型的工具使用能力,司南及合作伙伴团队推出了T-Eval评测基准,相关成果论文已被ACL 2024主会录用,点击链接可查看原文:h...
-
掌握 Llama 3.1:轻松本地部署与远程使用的全攻略
前言: Llama 3.1 是 Meta(Facebook 的母公司)发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B(80 亿参数)、70B(700 亿参数)和 405B(4050 亿参数)模型。其中,405B 是 Meta 迄...
-
AI绘画Stable Diffusion基础教程!
Ai绘图真的太火了,挡都挡不住。本着“不断好奇,不停学习”的理念,我打算介绍下Stable Diffusion,有兴趣的小伙伴可以一起学习。 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一...
-
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...
-
Flux.1 版本又更新,更快更省显存,画质依旧美丽!
小伙伴们都知道 Flux.1 的出图效果很棒,但是对电脑的配置要求也同样很高,随便就要十几 G 显存才能体验,光这配置就劝退了很多小伙伴。 硬件要求真的是硬伤,不过地球是圆的,技术也总是在发展的,就在这几天,ControlNet 的作者张吕敏大大带着他的...
-
Datawhale 魔搭 AI夏令营 第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习
AI生图的能力与局限 AI生图的原理 AI利用 深度学习技术来训练神经网络,训练过程中,神经网络会学习到真实图像中的纹理、结构、颜色等特征,并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后,通过输入关键提示词来让模型...
-
本地部署,Whisper: 开源语音识别模型
目录 简介 特点 应用 使用方法 总结 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Reco...
-
使用llama factory对语言模型微调,重塑自我认知,并部署于ollama上
本文记录了从环境部署到微调模型、效果测试并部署的全过程。 一 环境 如果使用autodl租赁服务器则不需要如下步骤,但是请注意llama_factory需要python、cuda等版本满足: 首先请确报你已经安装好了conda工具...
-
Python虚拟环境:使用venv隔离项目依赖
前言 在开发Python项目时,管理项目的依赖关系是一个常见的挑战。不同项目可能需要不同版本的库,如果不加以管理,很容易导致依赖冲突和环境混乱。幸运的是,Python提供了虚拟环境(virtual environment)的解决方案,帮助我们隔离项目依...
-
Llama中文大模型-模型微调
同时提供了LoRA微调和全量参数微调代码,关于LoRA的详细介绍可以参考论文“[LoRA: Low-Rank Adaptation of Large Language Models](https://arxiv.org/abs/2106.09685 ”以及...
-
秋叶V4.9整合包发布!什么是Stable Diffusion?如何安装Stable Diffusion?
Stable Diffusion秋叶整合包,一键安装Stable Diffusion,门槛极低,完全免费,支持Nvidia全系列显卡。 来自B站up主秋葉aaaki近期推出的Stable Diffusion整合包v4.9版本,能够让零基础用户轻松在本地部...
-
stable diffusion 的四种换脸方法
前言: 很多人对ai 换脸换装都比较感兴趣,今天就记录一下目前主流的换脸方法!! 一、Roop插件 1.安装方法 roop安装及失败解决教程,你还没玩sd的换脸吗?_哔哩哔哩_bilibili 借用b站一个博主的视频教程,简单快捷方便 gi...
-
ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货)
原文链接: ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货) (chinaz.com Instant ID 是 controlnet 比较新的一个模型,主要作用也是固定人物的面部特征。它可以仅通过一张图片进行完美换脸,可能是...
-
【2024W30】肖恩技术周刊(第 8 期):奥运会热度不高?
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“工具分享”等。为减少阅读负担提高记忆留存率,每类下内容数一般不超过3条。更新时间: 星期天历史收录: shawn-weekly订阅方式:...
-
Feishu-Midjourney 开源项目实战指南
Feishu-Midjourney 开源项目实战指南 Feishu-Midjourney? 飞书 x midjourney = 你真正的创意伙伴项目地址:https://gitcode.com/gh_mirrors/fe/Feishu-Midjourn...
-
本地部署 Llama-3-EvoVLM-JP-v2
本地部署 Llama-3-EvoVLM-JP-v2 0. 引言 1. 关于 Llama-3-EvoVLM-JP-v2 2. 本地部署 2-0. 克隆代码 2-1. 安装依赖模块 2-2. 创建 Web UI 2-3.启动 Web UI 2-4...
-
字节跳动与南开联合开源 StoryDiffusion:一键生成漫画和视频故事的神器!完全免费!
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~ 漫画,是多少人童年的回忆啊! 记得小学时的同桌,经常支起课本,后面夹着一本漫画书在看。(哈哈...
-
小白教程:Unsloth 打造属于自己的中文版Llama3
在定制化业务场景中,如果利用专属数据集,经过微调的大模型能够在多种任务上与GPT-4媲美,并支持本地部署,保护隐私,同时还能降低运算成本。最新推出的Llama3,作为当前性能最强的开源基础大模型,非常适用于自然语言处理、机器翻译、文本生成、问答系统、聊天机...