tpu 第18页 - AIGC资讯

whisper使用方法

看这个 github https://github.com/Purfview/whisper-standalone-win/tags 下载视频提取音频 ffmpeg -i 222.mp4 -vn -b:a 128k -c:a mp3 outpu...

生成式AI 2024-01-04 人工智能

860阅读

[linux-sd-webui]api化之训练lora

lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的，需要准备相应的训练数据。 1.训练数据准备使用deepbooru/blip生成训练数据，建筑类建议使...

AIGC 2024-01-04 人工智能

1036阅读

Stable Diffusion (持续更新)

引言本文的目的为记录stable diffusion的风格迁移，采用diffusers example中的text_to_image和textual_inversion目录 2023.7.11 收集了6张水墨画风格的图片，采用textual_...

大数据 2024-01-04 人工智能

929阅读

stable diffusion（安装以及模型的初步使用）

本机的配置能跑模型，本地也跑过一点Lora训练的脚本，看看几个效果：以上的都是配合huggingface有的模型结合civitai上的Lora模型在本地跑出来的图片，自己本地训练的Lora太拉闸了，就不放上来了…… 1....

生成式AI 2024-01-03 人工智能

965阅读

保姆级教程：从0到1使用Stable Diffusion XL训练LoRA模型 |【人人都是算法专家】

Rocky Ding 公众号：WeThinkIn 写在前面【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习? 大家好...

生成式AI 2024-01-03 人工智能

1278阅读

突破Pytorch核心点，CNN ！！！

哈喽，我是小壮！创建卷积神经网络（CNN），很多初学者不太熟悉，今儿咱们来大概说说，给一个完整的案例进行说明。 CNN 用于图像分类、目标检测、图像生成等任务。它的关键思想是通过卷积层和池化层来自动提取图像的特征，并通过全连接层进行分类。原理 1.卷...

大数据 2024-01-03 人工智能

805阅读

使用Google大模型Bard(PaLM)理解时间序列预测模型ARIMA

使用Bard模型理解时间序列预测模型ARIMA Q: explains ARIMA model (注释：让Bard解释下时间序列预测模型ARIMA Q: explains the AR sub model in ARIMA model, gi...

人工智能 2024-01-03 人工智能

820阅读

突破Pytorch核心点，模型定义与搭建！！

嗨，我是小壮！咱们今儿来聊聊关于模型定义与搭建。很适合初学者！在使用PyTorch进行深度学习时，首先需要了解的是如何定义和搭建模型。这块内容非常重要。在PyTorch中，模型的定义通常通过创建一个继承自torch.nn.Module的类来完成。...

人工智能 2024-01-02 人工智能

803阅读

Stable-diffusion WebUI API调用方法

写这篇文章的主要原因是工作中需要写一个用训练好的模型批量生图的脚本，开始是想用python直接加载模型，但后来发现webui的界面中有很多用起来比较方便的插件和参数，最终改成调用WebUI接口的方式来批量生图。 Stable-diffusion的webu...

人工智能 2024-01-02 人工智能

978阅读

stable diffusion webui 教程：安装与入门

stable diffusion webui 安装与入门原理简介一、源码仓库二、模型库地址三、在 Windows 上自动安装步骤安装Python 安装git 下载源代码编辑 webui-user.bat 四、如何打开五、依据文...

大数据 2024-01-02 人工智能

1262阅读

手把手教你通过PaddleHub快速实现输入中/英文本生成图像（Stable Diffusion）

近来，基于Diffusion的文图生成模型比较火，用户输入一句话，模型就可以生成一副对应的图像，还是很有意思的。本文记录了通过PaddleHub快速实现上述任务的过程，以供参考。 1、安装PaddlePaddle PaddleHub底层依赖于百度自研的...

大数据 2024-01-01 人工智能

1286阅读

一文通透位置编码：从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long

前言关于位置编码和RoPE 应用广泛，是很多大模型使用的一种位置编码方式，包括且不限于LLaMA、baichuan、ChatGLM等等我之前在本博客中的另外两篇文章中有阐述过(一篇是关于LLaMA解读的，一篇是关于transformer从零实现...

人工智能 2024-01-01 人工智能

1126阅读

神经网络中的分位数回归和分位数损失

在使用机器学习构建预测模型时，我们不只是想知道“预测值(点预测 ”，而是想知道“预测值落在某个范围内的可能性有多大(区间预测 ”。例如当需要进行需求预测时，如果只储备最可能的需求预测量，那么缺货的概率非常的大。但是如果库存处于预测的第95个百分位数(需求...

AIGC 2024-01-01 人工智能

857阅读

[玩转AIGC]LLaMA2之如何微调模型

目录 1、下载训练脚本 2、下载模型 2.1、申请下载权限 2.2、模型下载 3、模型微调 3.1、使用单卡微调 3.2、使用多卡训练： 1、下载训练脚本首先我们从github上下载Llama 2的微调代码：GitHu...

大数据 2024-01-01 人工智能

1074阅读

大模型部署手记（11）LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+llama.cpp+中文对话

1.简介：组织机构：Meta（Facebook）代码仓：GitHub - facebookresearch/llama: Inference code for LLaMA models 模型：LIama-2-7b-hf、Chinese-LLaMA...

AIGC 2023-12-31 人工智能

990阅读

一个超强 Pytorch 操作！！

哈喽，我是小壮！这几天关于深度学习的内容，已经分享了一些。另外，类似于numpy、pandas常用数据处理函数，在Pytorch中也是同样的重要，同样的有趣！！ Pytorch同样提供了许多用于数据处理和转换的函数。今儿来看下，最重要的几个必会函数...

大数据 2023-12-31 人工智能

805阅读

lag-llama源码解读(Lag-Llama: Towards Foundation Models for Time Series Forecasting)

Lag-Llama: Towards Foundation Models for Time Series Forecasting 文章内容：时间序列预测任务，单变量预测单变量，基于Llama大模型，在zero-shot场景下模型表现优异。创新点，引入滞后...

AIGC 2023-12-31 人工智能

979阅读

Stable diffusion环境部署搭建

1、安装Nvidia驱动、cuda版本等略 2、安装anaconda环境略 3、安装git #git工具的安装参考下面命令 apt-get update -y a pt-get upgrade -y apt install git 4、...

人工智能 2023-12-30 人工智能

969阅读

Hugging Face使用Stable diffusion Diffusers Transformers Accelerate Pipelines VAE

Diffusers A library that offers an implementation of various diffusion models, including text-to-image models. 提供不同扩散模型的实现的库，代...

人工智能 2023-12-30 人工智能

987阅读

今年很火的AI绘画怎么玩

1.前言 2022年绝对可以说是AIGC元年，从google搜索的趋势来看，在2022年AI绘画及AI生成艺术的搜索量激增。 AI绘画在这一年的爆发一个很重要的原因就是 Stable Diffusion 的开源，这也来不开这几年 Diffusion...

大数据 2023-12-30 人工智能

924阅读

AIGC盛行，带你轻松调用开发

文章目录前言一、?AIGC简介二、?开通体验开通模型获取API-KEY 三、?基于java实现调用 1.设置API-KEY 2.体验大语言模型多轮对话演示补充流式输出 3.体验通义千问VL 使用官方提供照片本地文件多轮对...

生成式AI 2023-12-30 人工智能

1137阅读

安装stable diffusion报错

安装stable diffusion报错总是报 RuntimeError: Couldn’t install gfpgan. 最终解决方案参照网络文章：https://zhuanlan.zhihu.com/p/608397859 设置了以下之后再重新运...

人工智能 2023-12-30 人工智能

834阅读

在自定义数据集上微调Alpaca和LLaMA

本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA，我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程，本文将涵盖数据处理、模型训练和使用流行的自然语言处理库(如Transformers和hugs Face 进行评估。此外还将介...

生成式AI 2023-12-29 人工智能

939阅读

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

在大模型领域，一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B 模...

人工智能 2023-12-29 人工智能

1075阅读

精调llama模型

github地址：https://github.com/facebookresearch/llama-recipes github:https://github.com/facebookresearch/llama import torch from t...

人工智能 2023-12-28 人工智能

868阅读

人工智能 | Llama大模型：与AI伙伴合二为一，共创趣味交流体验

Llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，LL...

AIGC 2023-12-28 人工智能

919阅读

大模型+机器人，详尽的综述报告来了，多位华人学者参与

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 -...

AIGC 2023-12-27 人工智能

898阅读

得物大模型平台，业务效果提升实践

一、背景得物大模型训练与推理平台上线几个月后，我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面，取得了显著的成效，例如：效率相关部门的合作，多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务，提升了效...

大数据 2023-12-27 人工智能

841阅读

人脸识别技术演进：从几何算法到深度学习的深度剖析

本文全面探讨了人脸识别技术的发展历程、关键方法及其应用任务目标，深入分析了从几何特征到深度学习的技术演进。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实...

生成式AI 2023-12-27 人工智能

1055阅读

LLaMa、Qwen、ChatGLM、ChatGLM2的区别

LLaMa、Qwen、ChatGLM、ChatGLM2的区别以下比较的前提是首先和BERT(transfomer 的对比感谢帮忙给我github repository的star，更多最新模型长期更新：https://github.com/zysN...

人工智能 2023-12-27 人工智能

1707阅读

基于Gradio/Stable Diffusion/Midjourney的AIGC自动图像绘画生成软件 - Fooocus

0.参考本项目：GitHub - lllyasviel/Fooocus: Focus on prompting and generating 作者：Lvmin Zhang 编辑 lllyasviel 另一杰作 ContorlNet https...

大数据 2023-12-26 人工智能

2544阅读

LLM微调（四）| 微调Llama 2实现Text-to-SQL，并使用LlamaIndex在数据库上进行推理

Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜（https://huggingface.co/spaces/HuggingFaceH4/open_llm_lea...

AIGC 2023-12-25 人工智能

910阅读

10条行之有效的实践途径，将ChatGPT融入开发

在不断变化的技术领域中，ChatGPT及其AI聊天机器人的同类产品正在引领潮流，获得全球的关注。这类产品正在通过提供被认为不可实现的独特价值主张，重新塑造行业格局。对于软件开发人员来说，这些机器人提供了无限的可能性。本文介绍开发人员如何利用AI聊天机器人...

生成式AI 2023-12-25 人工智能

874阅读

Python+AI实现AI绘画

? 运行环境：Python ? 撰写作者：左手の明天 ? 精选专栏：《python》 ? 推荐专栏：《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???，我是左手の明天！好久不见? ?今天分享py...

人工智能 2023-12-25 人工智能

930阅读

挑战Transformer的Mamba是什么来头？作者博士论文理清SSM进化路径

在大模型领域，Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长，Transformer 的局限性也逐渐凸显，比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷，研究者们开发出了很多...

生成式AI 2023-12-25 人工智能

1145阅读

Stable Diffusion - Easy Diffusion 图像生成工具的环境配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://blog.csdn.net/caroline_wendy/article/details/131524075 版本v2.5.41 Stab...

大数据 2023-12-25 人工智能

1347阅读

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

Paper name LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Paper Reading Note Paper URL: htt...

人工智能 2023-12-25 人工智能

912阅读

“私密离线聊天新体验！llama-gpt聊天机器人：极速、安全、搭载Llama 2，尽享Code Llama支持！”

“私密离线聊天新体验！llama-gpt聊天机器人：极速、安全、搭载Llama 2，尽享Code Llama支持！” 一个自托管的、离线的、类似chatgpt的聊天机器人。由美洲驼提供动力。100%私密，没有数据离开您的设备。 Demo http...

AIGC 2023-12-25 人工智能

916阅读

LLM-LLaMA：使用Huggingface提供的脚本文件，对原始的LLaMA-13B转换为Huggingface的格式

使用Huggingface提供的脚本文件，对原始的LLaMA-13B转换为Huggingface的格式，具体的脚本文件在此处。下面是运行的命令（假设下载的原始文件位于./下，希望转换后的路径为./converted）： python convert...

人工智能 2023-12-25 人工智能

879阅读

文字识别表格识别，这个库直接调用

PaddleOCR是一个基于PaddlePaddle深度学习框架开发的开源OCR（Optical Character Recognition）工具。除了光学字符识别（OCR）功能外，最新版本的PaddleOCR还引入了表格识别功能。表格识别是一种将图像...

人工智能 2023-12-24 人工智能

1146阅读

midjourney指令笔记+踩坑日记+gpt论文润色指令

跟人拼团入手了midjourney，长期记录更新。 midjourney指令笔记+踩坑日记指令笔记踩坑日记 GPT论文润色指令指令一指令二指令三指令四指令五指令笔记关键词参考网址：prompttool...

AIGC 2023-12-24 人工智能

1036阅读

AI绘画中CLIP文本-图像预训练模型

介绍 OpenAI 在 2021 年提出了 CLIP（Contrastive Language–Image Pretraining）算法，这是一个先进的机器学习模型，旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行...

AIGC 2023-12-24 人工智能

1039阅读

OpenAI Whisper + FFmpeg + TTS：动态实现跨语言视频音频翻译

本文作者系360奇舞团前端开发工程师摘要：本文介绍了如何结合 OpenAI Whisper、FFmpeg 和 TTS（Text-to-Speech）技术，以实现将视频翻译为其他语言并更换声音的过程。我们将探讨如何使用 Ope...

生成式AI 2023-12-24 人工智能

1160阅读

Ubuntu 22.04安装英特尔显卡驱动玩转AIGC

作者：英特尔网路与边缘计算事业部开发者关系经理李翊玮本文将介绍如何使用EIV 用5行指令在快速搭建含英特尔显卡及OpenVINO的AI开发环境, 并简洁说明如何使用OpenVINO 及英特尔显卡优化文生图模型Stable Diffusion 的速度。...

AIGC 2023-12-24 人工智能

1191阅读

baichuan-7B-chat微调报错及解决记录使用的仓库：LLaMA-Factory 2023年11月27日

我所使用的代码仓库是LLaMA-Factoryhiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, Chat...

大数据 2023-12-24 人工智能

1713阅读

Install Stable Diffusion WebUI on Ubuntu 22.04.2 LTS

1. Environment OS：Ubuntu 22.04 LTS Kernel：5.15.0-60-generic CPU: Intel(R Xeon(R Gold 6278C CPU @ 2.60GHz, 8vCPUs GPU: 1 * N...

人工智能 2023-12-24 人工智能

918阅读

GPT系列训练与部署——GPT2环境配置与模型训练

本文为博主原创文章，未经博主允许不得转载。本文为专栏《Python从零开始进行AIGC大模型训练与推理》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/13...

大数据 2023-12-24 人工智能

986阅读

最强英文开源模型LLaMA架构探秘，从原理到源码

导读：LLaMA 65B是由Meta AI（原Facebook AI）发布并宣布开源的真正意义上的千亿级别大语言模型，发布之初（2023年2月24日）曾引起不小的轰动。LLaMA的横空出世，更像是模型大战中一个搅局者。虽然它的效果（performance）...

人工智能 2023-12-24 人工智能

1318阅读

Stable Diffusion攻略集（Stable Diffusion官方文档、kaggle notebook、webui资源帖）

文章目录第一部分一、 Features：Textual Inversion（文本反转） 1.1 Textual Inversion 简介 1.1.1 摘要 1.1.2 算法 1.1.3 模型效果 1.2 Textual Invers...

AIGC 2023-12-23 人工智能

1361阅读

【Stable Diffusion/NovelAI Diffusion的AMD GPU加速推理探索】

测试机子配置： 1：AMD RX6600(显存8g +i5 12600KF 16g内存 (台式机 2：RTX 3070 laptop(显存8g +i7 10870H 32g内存 (HP暗夜精灵笔记本两台电脑平均性能差不多，当然N卡肯定更好一点这边...

人工智能 2023-12-23 人工智能

976阅读