-
LLama-Factory使用教程
本文是github项目llama-factory的使用教程 注意,最新的llama-factory的github中训练模型中,涉及到本文中的操作全部使用了.yaml配置。 新的.yaml的方式很简洁但不太直观,本质上是一样的。新的readme中的.yam...
-
AI多模态实战教程:面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理
一、项目简介 MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型(MLLMs),提供⾼质量的⽂本输出,已发布4个版本。 1.1 主要模型及特性 (1)MiniCPM-Llama3-V 2.5: 参数规模: 8B 性能: 超越...
-
LLMs之Llama 3.1:Llama 3.1的简介、安装和使用方法、案例应用之详细攻略
LLMs之Llama 3.1:Llama 3.1的简介、安装和使用方法、案例应用之详细攻略 导读:2024年7月23日,Meta重磅推出Llama 3.1。本篇文章主要提到了Meta推出的Llama 3.1自然语言生成模型。 >>...
-
LLM大模型实战项目--基于Stable Diffusion的电商平台虚拟试衣
本文详细讲解LLM大模型实战项目,基于Stable Diffusion的电商平台虚拟试衣 一、项目介绍 二、阿里PAI平台介绍 三、阿里云注册及开通PAI 四、PAI_DSW环境搭建 五、SD+LORA模型微调 一、项目介绍 ...
-
Linux系统上部署Whisper。
Whisper是一个开源的自动语音识别(ASR)模型,最初由OpenAI发布。要在本地Linux系统上部署Whisper,你可以按照以下步骤进行: 1. 创建虚拟环境 为了避免依赖冲突,建议在虚拟环境中进行部署。创建并激活一个新的虚拟环境: 如果不...
-
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序 在人工智能领域中,语音识别技术日益成为核心组成部分,尤其是在实时翻译、字幕制作和无障碍沟通等方面。OpenAI 的 Whisper 模型以及其优化版本 Faster-...
-
如何有效地使用Code Llama:AI编程助手的实用指南
在当今快速发展的人工智能时代,编程领域也迎来了革命性的变革。Meta公司最近发布的Code Llama模型就是这一趋势的代表作。本文将深入探讨如何充分利用Code Llama的各种功能,为开发者提供一个全面的指南,帮助您更好地理解和应用这一强大的AI编程工...
-
政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署ComfyUI:功能最强大、模块化程度最高的Stable Diffusion图形用户界面和后台
目录 ComfyUI的特性介绍 开始安装 做点准备工作 在Conda虚拟环境中进行 依赖项的安装 运行 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: 零基础玩转各类开源AI项目 希望政安晨的博客能够对...
-
whisper-api语音识别语音翻译高性能兼容openai接口协议的开源项目
whisper-api 介绍 使用openai的开源项目winsper语音识别开源模型封装成openai chatgpt兼容接口 软件架构 使用uvicorn、fastapi、openai-whisper等开源库实现高性能接口 更多介绍 h...
-
AIGC实战:LLaMA2打造中文写作利器——数据准备与模型训练全攻略
目录 一、下载并加载中文数据集 二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1)先将一篇篇文本拼凑到一起(只是简单的拼凑一起,用于训练tokenizer) 2...
-
2024年Stable Diffusion下载+安装+使用教程(超详细版本)收藏这一篇就够了!
本篇咱们要聊的是如何用“整合包”来搞定StabIe Diffusion WebUI的本地安装和使用,别担心,你不需要成为计算机大神,新手也能轻松上手。不过得提醒一下,你的硬盘得留出100G~200G的空间来,才能玩得转。 整合包放这里,添加领取哦。 咱...
-
AI绘图赚钱,普通人用Stable diffusion 还是Midjourney,他们有什么区别?
给大家用2000字说一下Stable Diffusion 和Midjourney 从前期部署→到操作生成→再到效果及应用,为你分析两者之间的区别。 SD控制性极强,可高度自定义,难度大,完全免费。 MJ对小白非常友好,图片质量高,模型有限,插件少,控制...
-
【Stable Diffusion】ComfyUI-插件-生成透明通道素材!
前言 哈喽大家好,刚接触SD生成素材的时候,就想过能不能一步到位,直接生成带透明通道的图层,这期分享下ComfyUI中的这种插件,开始之前先来感受下 透明通道素材 1、安装插件 将zip的压缩包解压到以下路径 ···\ComfyUI\cus...
-
【爆】Stable Diffusion【真人模型】:全网最真实的亚洲女性大模型
模型v1下载:XXMix_9realisticSDXL-Checkpoint-展夜枭-LiblibAI 环境要求: gpu:12G+ 最好16G+ python:3.10 cuda:11.8 一、介绍 XXMix_9realisticSDXL是...
-
llama_index,一个超强的 Python 库!
更多资料获取 📚 个人网站:ipengtao.com 大家好,今天为大家分享一个超强的 Python 库 - llama_index。 Github地址:https://github.com/run-llama/llama_index 在信息...
-
llama 2 改进之 RMSNorm
RMSNorm 论文:https://openreview.net/pdf?id=SygkZ3MTJE Github:https://github.com/bzhangGo/rmsnorm?tab=readme-ov-file 论文假设LayerNorm...
-
【AIGC】Llama-3 官方技术报告
Llama-3 技术报告(中文翻译) 欢迎关注【youcans的AGI学习笔记】原创作品 0. 简介 现代人工智能(AI)系统的核心驱动力来自于基础模型。 本文介绍了一组新的基础模型,称为 Llama 3。它是一个语言模型系列,原生支持多语言...
-
音频转文字哪家强?faster-whisper还是paddlespeech,我的折腾吐槽记录
前言 作为一个魔武双修的python程序员,面对产品小姐姐提出的需求。我只能迎难而上。 目前开源的音频转文字都有哪些?效果如何?速度怎么样?带着这一连串的问题,我在github的海洋里畅游良久。接下来我把我的发现都记录如下。 1. paddles...
-
阿里云OS Copilot:解锁操作系统运维与编程的智能助手
目录 引言 OS Copilot简介 OS Copilot的环境准备 创建实验资源 安全设置 设置安全组端口 创建阿里云AccessKey 准备系统环境 OS Copilot的实操 场景一、用OS Copilot写脚本和注释代码 ...
-
hunyuandit_pytorch AIGC 以文生图模型
HunyuanDiT 论文 Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding https:/...
-
【奶奶看了都会了】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程
1.作品图 2.准备工作 目前网上能搜到的stable-diffusion-webui的安装教程都是Window和Mac M1芯片的,而对于因特尔芯片的文章少之又少,这就导致我们还在用老Intel 芯片的Mac本,看着别人生成美女图片只能眼...
-
项目实训:python whisper安装运行 实现语音识别技术
1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...
-
函数调用:在 xLAM 上微调 Llama 3得益于 QLoRA,速度快且内存高效
欢迎来到雲闪世界.最近的大型语言模型 (LLM 在大多数语言生成任务中都表现出色。然而,由于它们基于下一个标记预测进行操作,因此它们通常难以准确执行数学运算。此外...
-
开源语音转文本 Speech-to-Text 大模型实战之Whisper篇
前言 随着深度学习技术的不断发展,语音转文本(Speech-to-Text,STT)技术取得了显著的进步。开源社区涌现了许多高效的STT大模型,为开发者提供了强大的工具。本文将以OpenAI推出的Whisper模型为例,详细介绍如何使用该模型进行语音转文...
-
【AI大模型】程序员AI的未来——Copilot还是Claude3.5 Sonnet?
近期,Anthropic发布了Claude 3.5 的“大杯”模型 —— Claude 3.5 Sonnet! 这次发布的 Sonnet 代表意大利的“十四行诗”,结构复杂,在智能水平、功能多样性和处理能力上都有所提升,能够应对更复杂的认知任务,提供更高...
-
AIGC | Ubuntu24.04桌面版安装后必要配置
[ 知识是人生的灯塔,只有不断学习,才能照亮前行的道路 ] 0x02 Ubuntu 24.04 桌面版必要配置 1.网络配置 描述:Ubuntu 24.04 与CentOS/Redhat系列主机网络配置是不一样,从Ubuntu 20...
-
stable diffusion中dreambooth模型训练
stable diffusion中dreambooth模型训练 简介 一、参考材料 二、运行备注 模型训练步骤 一、连接服务器 二、虚拟环境配置 简介 一、参考材料 1、Github项目网址 2、huggingface...
-
【AIGC】AI-Agents最新成果-斯坦福AI小镇源码解读
写在前面的话: 今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 RPG 虚拟世界,其中 25 个角色由 GPT 和自定义代码控制,并在arxiv上提交了论文版本,引起了对AIGC+游戏的广泛讨论; 8月,该项目在GitHub上正式开源...
-
手把手教你在autodl上部署llama模型
文章目录 一、注册AutoDL账号、租用GPU 二、创建conda环境 三、下载llama模型 四、启动模型 一、注册AutoDL账号、租用GPU 进入 AutoDL官网链接 注册账号,需要先充点钱,如下创建新实例。 随便选...
-
大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了
继分不清9.11和9.9哪个大以后,大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”,再次引起一片讨论。 GPT-4o不仅错了还很自信。 刚出炉的Llama-3.1405B,倒是能在验证中发现问题并改正。 比较离谱的是Clau...
-
使用Llama3/Qwen2等开源大模型,部署团队私有化Code Copilot和使用教程
目前市面上有不少基于大模型的 Code Copilot 产品,部分产品对于个人开发者来说可免费使用,比如阿里的通义灵码、百度的文心快码等。这些免费的产品均通过 API 的方式提供服务,因此调用时均必须联网、同时需要把代码、提示词等内容作为 API 的入参在...
-
Stable Diffusion的魔法配方:LORA模型中的自适应激活函数探秘 ???
Stable Diffusion的魔法配方:LORA模型中的自适应激活函数探秘 ??? 激活函数:神经网络的灵魂调料 基础概念小课堂 自适应激活函数:灵活应变的艺术 什么是自适应激活? LORA中的自适应激活探索 代码实践:打造自适应魔法...
-
双非本科工程造价专业,转行AIGC产品经理,涨薪65%
大家好,我是一名证券产品转AIGC产品经理的案例,学习课程后,入职一家内容创作工具公司,薪资也有了较大提升,经过测算涨幅也是超过了65%。 新公司的主要产品是视频和图文创作工具,服务对象主要是金融客户和电商客户两类群体,主要使用场景是用来创作短视频和图文...
-
基于Llama Index构建RAG应用(Datawhale AI 夏令营)
前言 Hello,大家好,我是GISer Liu😁,一名热爱AI技术的GIS开发者,本文参与活动是2024 DataWhale AI夏令营;😲 在本文中作者将通过: Gradio、Streamlit和LlamaIndex介绍 Ll...
-
探究AIGC的底层逻辑:从技术到应用的全面解析
目录 探究AIGC的底层逻辑:从技术到应用的全面解析 技术原理 使用方法 最佳实践和注意事项 结论 探究AIGC的底层逻辑:从技术到应用的全面解析 在人工智能领域,AIGC(AI对话大师)是一种语言生成模型,由OpenAI开发并用于构建...
-
使用LLaMA-Factory微调大模型
使用LLaMA-Factory微调大模型 github 地址https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/...
-
Llama 3模型:更自由、更强大的AI对话体验
引言 人工智能领域正在经历一场革命,大型语言模型(LLM)的不断进步正在重塑我们与机器交互的方式。在这个快速发展的领域中,Meta公司推出的Llama系列模型一直备受关注。最新发布的Llama 3模型在多个方面都展现出了显著的进步,尤其是在减少不必要的...
-
Windows下安装LLama-Factory
在进行安装前,请先确认你的GPU能支撑起训练的显存。如果和可怜的我一样是4GB可以选择上云或者换一个好一点的显卡。并且确定你安装了显卡驱动版本在官方给的版本以上,如果没有安装,详细参考我的另一篇文章:LLama-Factory运行异常,CU...
-
国内Ubuntu安装 stable-diffusion教程,换成国内镜像
安装依赖: 首先更新系统并安装Python 3.10和pip: sudo apt update sudo apt install python3.10 python3-pip 设置Python虚拟环境(可选): 安装Python虚拟环境管理工具,并创建...
-
阿里开源语音大模型:SenseVoice 识别,语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等!
阿里开源语音大模型:语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等! 原创 kakuqo AI真好玩 2024年07月06日 10:21 福建 语音识别技术在人工智能(AI)领域扮演着至关重要的角色,它不仅是人机交互的基石,也是推动...
-
LLaMa-Factory微调chatglm3实战
文章目录 算力机器准备 LLMa-Factory环境搭建 克隆项目 创建环境(可省略) 遇到问题 解决方法 安装依赖 启动web UI页面 设置代理(本地浏览器访问) 下载模型 准备数据集 微调 加载新模型 成果测试 算力机...
-
爬虫 — 自动化爬虫 Selenium
目录 一、介绍 二、对比 三、安装 四、简单使用 五、定位元素 1、By.ID 2、By.CLASS_NAME 3、By.NAME 4、By.TAG_NAM 5、By.XPATH 六、操作元素 1、在输入框输入内容并搜索 2、...
-
llama_index.core没办法导入向量
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader 报错:error msg: ImportError: cannot import name 'VectorStore...
-
Stable Diffusion 深度探索:从入门到精通的全方位教程
在人工智能艺术创作的浪潮中,Stable Diffusion 作为一股不可忽视的力量,正以其独特的魅力吸引着无数创作者和科技爱好者的目光。本文旨在为大家提供一份详尽的 Stable Diffusion 教程,从基础概念到高级应用,带领你一步步走进这个充满无...
-
LLaMA-Factory/scripts/length_cdf.py 源码解析
这段代码定义了一个函数 length_cdf,用来计算和打印数据集样本长度的累积分布函数(CDF),并在脚本直接运行时通过 fire 库将该函数暴露为命令行接口。我们逐行解释这段代码: python 复制 from llmtuner.data imp...
-
快速上手文心一言指令:从零开始的详细指南
快速上手文心一言指令:从零开始的详细指南 一、引言 随着人工智能技术的不断进步,自然语言处理(NLP)已成为现代计算机科学和人工智能领域中的一个重要研究方向。它不仅在学术界取得了显著成果,更在实际应用中展现出巨大的价值,如智能客服、文本生成、情感分...
-
给 「大模型初学者」 的 LLaMA 3 核心技术剖析
编者按: 本文旨在带领读者深入了解 LLaMA 3 的核心技术 —— 使用 RMSNorm 进行预归一化、SwiGLU 激活函数、旋转编码(RoPE)和字节对编码(BPE)算法。RMSNorm 技术让模型能够识别文本中的重点,SwiGLU 激活函数则如同“...
-
Mac安装stable diffusion 工具
文章目录 1.安装 Homebrew 2.安装 stable diffusion webui 的依赖 3.下载 stable diffusion webui 代码 4.启动 stable diffusion webui 本体 5.下载模型 6....
-
openai 开源模型Whisper语音转文本模型下载使用
Whisper Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。官方地址 https://github.com/openai/whisper 方法...
-
AI绘画工具SD的安装
目录 Stable Diffusion软件包的官方下载地址是什么? 如何确保设备满足Stable Diffusion的硬件与软件要求? 硬件要求 软件要求 Stable Diffusion安装过程中常见的问题及其解决方案有哪些? 如何选择适...