预训练模型第9页

ControlNet 和 T2I-Adapter，控制Stable Diffusion的不受控制的力量,AI 图像生成精确控制的破冰解决方案(教程含免安装使用方式)

控制Stable Diffusion的不受控制的力量人工智能艺术社区的兴奋在最近几天达到顶峰，让我想起了去年 Stable Diffusion 的首次发布。本次重点介绍基于Stable Diffusion 1.5的轻量级预训练模型ControlNet...

AIGC 2023-11-28 人工智能

762阅读

大模型之Bloom&LLAMA----RHLF(强化学习)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

大数据 2023-11-28 人工智能

803阅读

通过 Amazon SageMaker JumpStart 部署 Llama 2 快速构建专属 LLM 应用

来自 Meta 的 Llama 2 基础模型现已在 Amazon SageMaker JumpStart 中提供。我们可以通过使用 Amazon SageMaker JumpStart 快速部署 Llama 2 模型，并且结合开源 UI 工具...

人工智能 2023-11-28 人工智能

732阅读

【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型

文章目录一、背景二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择三、效果四、思考论文：Learning Transferabl...

AIGC 2023-11-27 人工智能

2021阅读

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...

AIGC 2023-11-27 人工智能

1248阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数...

大数据 2023-11-26 人工智能

808阅读

Stable Diffusion：使用自己的数据集微调训练LoRA模型

Stable Diffusion：使用自己的数据集微调训练LoRA模型前言前提条件相关介绍微调训练LoRA模型下载kohya_ss项目安装kohya_ss项目运行kohya_ss项目准备数据集生成关键词模型参数设置预训...

生成式AI 2023-11-25 人工智能

1105阅读

大模型之Bloom&LLAMA----Pre-Training(二次预训练)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

生成式AI 2023-11-25 人工智能

896阅读

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架)的简介、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架的简介、安装、案例实战应用之详细攻略导读：2023年07月31日，哈工大讯飞联合实验室，发布Chinese-LLaMA-Alpaca-2，本项目基于Meta发布的...

大数据 2023-11-25 人工智能

1239阅读

Meta AI研究团队新AI模型： Llama 2 大语言模型

Llama是Facebook Research团队开发的基础语言模型集，旨在提供广泛的语言理解能力。它基于转换器架构，参数范围从7B到65B。通过使用Llama模型，研究人员和开发人员可以构建更先进的自然语言处理系统。您可以在GitHub上找到相关的代...

人工智能 2023-11-25 人工智能

798阅读

【多模态】4、Chinese CLIP | 专为中文图文匹配设计

文章目录一、背景二、方法 2.1 基础内容 2.2 数据集 2.3 预训练方法 2.4 模型尺寸三、效果四、代码 4.1 推理论文：Chinese CLIP: Contrastive Vision-Language Pr...

人工智能 2023-11-24 人工智能

2234阅读

AI绘画使用Stable Diffusion（SDXL）绘制玉雕风格的龙

一、引言灵感来源于在逛 LibLib 时，看到的 Lib 原创者「熊叁gaikan」发布的「翠玉白菜 sdxl｜玉雕风格」的 Lora 模型。简直太好看了，一下子就被吸引了！科普下「翠玉白菜」：翠玉白菜是由翠玉所琢碾出白菜形状的清代文...

AIGC 2023-11-24 人工智能

963阅读

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation.py/tokenizer.py 目录一、l...

AIGC 2023-11-24 人工智能

662阅读

历数5年89篇研究，这篇综述告诉我们深度学习中的代码数据增强怎么样了

当今深度学习以及大模型的飞速发展，带来了对创新技术的不断追求。在这一进程中，代码数据增强技术显现出其不可忽视的价值。最近，由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调...

大数据 2023-11-23 人工智能

716阅读

Stable Video Diffusion来了，代码权重已上线

AI 画图的著名公司 Stability AI，终于入局 AI 生成视频了。本周二，基于 Stable Diffusion 的视频生成模型 Stable Video Diffusion 来了，AI 社区马上开始了热议。很多人都表示「我们终于等到了」...

AIGC 2023-11-22 人工智能

672阅读

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插

LLMs之Colossal-LLaMA-2：源码解读(train.py文件基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件 →数据预处理(初始化分词器+数据处理器+数据加载器 ...

大数据 2023-11-22 人工智能

658阅读

英伟达宣布首批采用面向生成式 AI 的 Spectrum-X 以太网技术的服务器产品线

英伟达日前宣布，戴尔科技、惠普企业和联想将成为首批将 NVIDIA Spectrum-X™以太网络技术集成到其服务器产品线中的公司，以帮助企业客户加快生成式人工智能工作负载的速度。 Spectrum-X 专为生成式人工智能而设计，为企业提供一种新型的以太...

AIGC 2023-11-22 人工智能

829阅读

ubuntu使用whisper和funASR-语者分离-二值化

文章目录一、选择系统 1.1 更新环境二、安装使用whisper 2.1 创建环境 2.1 安装 2.1.1安装基础包 2.1.2安装依赖 3测试1 3测试2 语着分离创建代码 `报错ModuleNotFoundError: N...

AIGC 2023-11-22 人工智能

1267阅读

由浅入深理解Latent Diffusion/Stable Diffusion(3)：一步一步搭建自己的Stable Diffusion Models

Diffusion Models专栏文章汇总：入门与实战前言：关于如何使用stable diffusion的文章已经够多了，但是由浅入深探索stable diffusion models背后原理，如何在自己的科研中运用stable diff...

AIGC 2023-11-21 人工智能

655阅读

Ubuntu llama 2搭建及部署，同时附问题与解决方案

本机环境： AMD Ryzen7480 OH with Radeon Graphics(16 CPUs ,~2.9GHz Card name: NVIDIA GeForce RTX 2060 虚拟机环境：内存：4G 存储：100G 一、搭建...

大数据 2023-11-21 人工智能

1453阅读

GPT-4V医学执照考试成绩超过大部分医学生，AI加入临床还有多远？

人工智能（AI）在医学影像诊断方面的应用已经有了长足的进步。然而，在未经严格测试的情况下，医生往往难以采信人工智能的诊断结果。对于他们来说，理解人工智能根据医学影像给出的判别，需要增加额外的认知成本。为了增强医生对辅助医疗的人工智能之间的信任，让 AI...

生成式AI 2023-11-21 人工智能

722阅读

深入理解LLaMA, Alpaca, ColossalChat 系列模型

知乎：紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca：大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...

AIGC 2023-11-21 人工智能

840阅读

大语言模型之七- Llama-2单GPU微调SFT

（T4 16G）模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener...

人工智能 2023-11-21 人工智能

823阅读

揭秘百度文心一言大模型：设计、应用与实战

导言在当今的深度学习领域，大型预训练模型如GPT、BERT等已经取得了显著的进展。而百度公司的文心一言大模型，作为一款基于Transformer结构的巨型模型，也在自然语言处理领域产生了重大影响。本文将详细介绍文心一言大模型的设计原理、特点以及应用场...

人工智能 2023-11-20 人工智能

1306阅读

AIGC：【LLM（一）】——LoRA微调加速技术

文章目录一.微调方法 1.1 Instruct微调 1.2 LoRA微调二.LoRA原理三.LoRA使用一.微调方法 Instruct微调和LoRA微调是两种不同的技术。 1.1 Instruct微调 Instr...

AIGC 2023-11-19 人工智能

1505阅读

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷，并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...

人工智能 2023-11-18 人工智能

778阅读

13B模型全方位碾压GPT-4？这背后有什么猫腻

一个参数量为 13B 的模型竟然打败了顶流 GPT-4？就像下图所展示的，并且为了确保结果的有效性，这项测试还遵循了 OpenAI 的数据去污方法，更关键的是没有发现数据污染的证据。如果你细细查看图中的模型，发现只要带有「rephraser」这个单词...

大数据 2023-11-18 人工智能

700阅读

写作AI软件哪个好用？安利三个AI写作生成器

曾经，写作是一项需要长时间学习和不断磨练的技能。但如今，随着写作AI软件的出现，任何人都可以轻松地创造出优秀的文章。这些软件通过深度学习算法和自然语言处理技术，将人工智能与写作完美结合，让写作变得更加简单高效。那你们知道写作AI软件哪个好用吗？下面...

AIGC 2023-11-18 人工智能

683阅读

LLaMA-7B微调记录

Alpaca（https://github.com/tatsu-lab/stanford_alpaca）在70亿参数的LLaMA-7B上进行微调，通过52k指令数据（https://github.com/tatsu-lab/stanford_alpaca/...

大数据 2023-11-17 人工智能

924阅读

什么是 AIGC，只能用于 AI 绘画吗？

2023 年，像是技术井喷的一年，在上半年的时间里，尤其是人工智能领域，大模型 ChatGPT 的爆火，随之让普罗大众了解到 AIGC（Artificial Intelligence Generated Content，生成式人工智能），但对于 AIGC...

生成式AI 2023-11-17 人工智能

724阅读

Insight量子位智库 ✪ AIGC/Al生成内容产业展望报告

AIGC全称为 Al-Generated Content，指基于生成对抗网络GAN、大型预训练模型等人工智能技术，通过已有数据寻找规律，并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media，合成式媒体，主要指基...

大数据 2023-11-17 人工智能

811阅读

【NLP】Llama & Alpaca大模型

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

生成式AI 2023-11-17 人工智能

713阅读

AIGC：使用bert_vits2实现栩栩如生的个性化语音克隆

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型，...

AIGC 2023-11-17 人工智能

1435阅读

【大模型系列 06】LLaMA-7B/13B for PyTorch 昇腾迁移

源码链接 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/PyTorch/built-in/foundation/LLaMA-13B LLaMA-7B/13B for PyTorch...

AIGC 2023-11-16 人工智能

857阅读

AI绘画使用Stable Diffusion（SDXL）绘制中国古代神兽

一、引言说到神奇异兽，脑海中首先就会跳出我国古代神话传说中的各种神兽。比如青龙、白虎、朱雀、玄武，再比如麒麟、凤凰、毕方、饕餮等等，这些都是大家耳熟能详的的神兽。这些神兽不仅体现了人们丰富的创造力和想象力，更是我国传统文化中的重要元素。那么这...

人工智能 2023-11-16 人工智能

1383阅读

足够惊艳，使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调，效果比肩斯坦福羊驼

之前尝试了从0到1复现斯坦福羊驼（Stanford Alpaca 7B），Stanford Alpaca 是在 LLaMA 整个模型上微调，即对预训练模型中的所有参数都进行微调（full fine-tuning）。但该方法对于硬件成本要求仍然偏高且训练低效...

生成式AI 2023-11-16 人工智能

649阅读

实时文生图速度提升5-10倍，清华LCM/LCM-LoRA爆火，浏览超百万

文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中，我们发现它们通常运行缓慢，导致我们要等一段时间才能拿到生成结果。但最近，一种名叫「LCM」的模型改变了这种情况，它甚至能做到实时的连续生图。图源：https://twitter.com/...

AIGC 2023-11-15 人工智能

765阅读

Yolo V8：深入探讨其高级功能和新特性

Yolo是一种计算机视觉模型，被广泛认为是目前最强大和最知名的模型之一。这一突破性技术被称为Yolo，它是“You Only Look Once”的缩写，是一种以几乎瞬间处理速度检测物体的方法。Yolo V8技术是这一技术的最新版本，也是对之前版本的一种...

生成式AI 2023-11-15 人工智能

2012阅读

最详细的Ubuntu服务器搭建Stable-Diffusion教程（无显卡，仅用CPU）

1. 首先安装基本工具 # 安装python环境 sudo apt install wget git 若已经安装过请忽略 2. 安装miniconda（也可以自己下载python）下载最新的安装包 wget https://repo.an...

AIGC 2023-11-14 人工智能

904阅读

自动代码Copilot背后的模型

文章目录 1.引入 2.评估框架 3.评估数据集 4.模型方法 5.实验结果 6.总结 7.参考之前，我已经介绍过Github发布的自动代码Copilot的使用方法，感兴趣的可以看这篇文章：Copilot要收费了？今天主要介绍一...

AIGC 2023-11-13 人工智能

895阅读

LoRAShear:微软在LLM修剪和知识恢复方面的最新研究

LoRAShear是微软为优化语言模型模型(llm 和保存知识而开发的一种新方法。它可以进行结构性修剪，减少计算需求并提高效率。 LHSPG技术（ Lora Half-Space Projected Gradient）支持渐进式结构化剪枝和动态知识恢复...

大数据 2023-11-13 人工智能

692阅读

Stable Diffusion云端部署流程与注意点

前言在今天的大数据时代，AI绘图是企业必备的重要工具之一。而Stable Diffusion作为一款部署的AI绘图，得到了很多企业和团队的认可。在使用Stable Diffusion的过程中，云部署是一个非常重要的话题，本文将详细介绍Stable Di...

人工智能 2023-11-13 人工智能

749阅读

解锁 PaddleOCR 的超能力

光学字符识别（OCR）是一项强大的技术，使机器能够从图像或扫描文档中识别和提取文本。OCR 在各个领域都有应用，包括文件数字化、从图像中提取文本以及基于文本的数据分析。在本文中，我们将探讨如何使用 PaddleOCR，一款基于深度学习的先进OCR工具包，...

生成式AI 2023-11-12 人工智能

844阅读

【网安AIGC专题10.11】2 ILF利用人类编写的自然语言反馈来训练代码生成模型：自动化反馈生成+多步反馈合并+处理多错误反馈+CODEGEN -M ONO 6.1 B model

Improving Code Generation by Training with Natural Language Feedback 写在最前面主要工作启发背景介绍应用现有工作的不足 Motivation动机方法 ILF...

大数据 2023-11-12 人工智能

911阅读

【AIGC】BaiChuan7B开源大模型介绍、部署以及创建接口服务

模型介绍 baichuan-7B是由百川智能开发的一个开源的大规模预训练模型。基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EV...

人工智能 2023-11-12 人工智能

868阅读

大语言模型之十五-预训练和监督微调中文LLama-2

这篇博客是继《大语言模型之十二 SentencePiece扩充LLama2中文词汇》、《大语言模型之十三 LLama2中文推理》和《大语言模型之十四-PEFT的LoRA》前面博客演示了中文词汇的扩充以及给予LoRA方法的预训练模型参数合并，并没有给出Lo...

大数据 2023-11-12 人工智能

1234阅读

[LLM+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析（文心一言 | 讯飞星火）

近年来，人工智能技术火热发展，尤其是OpenAI在2022年11月30日发布ChatGPT聊天机器人程序，其使用了Transformer神经网络架构（GPT-3.5），能够基于在预训练阶段所见的模式、统计规律和知识来生成回答，还能根据聊天的上下文进行互动，...

AIGC 2023-11-11 人工智能

767阅读

使用LoRA对大语言模型LLaMA做Fine-tune

使用LoRA对大语言模型LLaMA做Fine-tune 前言下载配置环境模型的训练 Fine-tune 模型的使用 Inference 参考问题汇总前言目前有大量对LLM（大语言模型）做Fine-tune的方式，不...

AIGC 2023-11-11 人工智能

1008阅读

大模型之Bloom&LLAMA----SFT(模型微调)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

大数据 2023-11-10 人工智能

755阅读

如何为制造业和自动化应用选择人工智能技术

在工业自动化领域的生产和实验室之外的日常生活中，人工智能(AI 的定义差异很大。 “人工智能”指的是一门包含了几种不同技术和工程学科的科学，包括机器视觉、计算机视觉、机器学习和深度学习。当一个基于这些技术组合的系统设计得当时（从应用分析到最终验证），它...

生成式AI 2023-11-10 人工智能

731阅读