预训练第38页 - AIGC资讯

LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插

LLMs之Colossal-LLaMA-2：源码解读(train.py文件基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件 →数据预处理(初始化分词器+数据处理器+数据加载器 ...

大数据 2023-11-22 人工智能

661阅读

英伟达宣布首批采用面向生成式 AI 的 Spectrum-X 以太网技术的服务器产品线

英伟达日前宣布，戴尔科技、惠普企业和联想将成为首批将 NVIDIA Spectrum-X™以太网络技术集成到其服务器产品线中的公司，以帮助企业客户加快生成式人工智能工作负载的速度。 Spectrum-X 专为生成式人工智能而设计，为企业提供一种新型的以太...

AIGC 2023-11-22 人工智能

835阅读

Nvidia和Genentech合作利用人工智能加速药物发现

Nvidia正在与生物技术巨头基因泰克公司（Genentech）合作，双方计划利用多年时间把最先进的人工智能功能（包括生成式AI）用于加速药物发现研究。 Nvidia表示，希望通过将其生成式AI模型和算法转变为“下一代AI平台”来加强Genentech...

AIGC 2023-11-22 人工智能

701阅读

10分钟搭建Stable Diffusion

前言人工智能生成内容（Artificial Intelligence Generated Content，简称 AIGC）是当下最火的概念之一。AIGC 被认为是继专业生成内容（Professional Generated Content, PGC）和...

人工智能 2023-11-22 人工智能

683阅读

ubuntu使用whisper和funASR-语者分离-二值化

文章目录一、选择系统 1.1 更新环境二、安装使用whisper 2.1 创建环境 2.1 安装 2.1.1安装基础包 2.1.2安装依赖 3测试1 3测试2 语着分离创建代码 `报错ModuleNotFoundError: N...

AIGC 2023-11-22 人工智能

1271阅读

【文心一言 vs. 通义千文】一言对千问：自百度之后，阿里终于还是出手了——通义千问

通义千问： https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录通义千问：达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...

人工智能 2023-11-22 人工智能

925阅读

【AI绘图】一、stable diffusion的发展史

一、stable diffusion的发展史本文目标：学习交流对于熟悉SD的同学，一起学习和交流使用过程中的技巧和心得。帮助新手帮助没有尝试过SD但又对它感兴趣的同学快速入门，并且能够独立生成以上效果图。 1.发展史介绍： 2...

AIGC 2023-11-22 人工智能

1288阅读

程序员眼中的 ChatGPT

作者 | Bright Liao 作为一个一直对AI 技术很感兴趣的软件开发工程师，早在深度学习开始火起来的2015、2016年，我就开始了相关技术的学习。当时还组织了公司内部同样有兴趣的同学一起研究，最终的成果汇集成几次社区中的分享以及几篇学习文章（见...

AIGC 2023-11-21 人工智能

662阅读

一切为了应用！九章云极DataCanvas大模型系列成果重磅发布！

11月21日，「筑基赋能智向未来」九章云极DataCanvas大模型系列成果发布会（以下简称“发布会”）在北京重磅召开，本次成果发布距离今年6月30日DataCanvas Alaya九章元识大模型公布仅4个多月，是九章云极DataCanvas公司大模...

AIGC 2023-11-21 人工智能

800阅读

中国AI今天的问题，是大模型又多又乱

OpenAI的开发者日活动后，GPTs模式引发了新一轮的AI热潮，开发者调用过分火爆，甚至导致OpenAI服务器一度宕机。随后，花式把玩GPTs的经验，以及围绕这种新形态的巨大争议开始涌现。中国的IT从业者、软件开发者与AI工程师也积极参与讨论，迎来了一场...

人工智能 2023-11-21 人工智能

717阅读

Stable Diffusion - 图像控制插件 ControlNet (OpenPose) 配置与使用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131591887 论文：Adding Conditional Co...

AIGC 2023-11-21 人工智能

1440阅读

“没有员工，OpenAI一无是处”

11月20日，微软CEO Satya Nadella最终告诉全世界，被OpenAI董事会罢免的CEO Sam Altman和因此辞职的董事会主席、总裁Greg Brockman加入微软。 OpenAI也为自己找到了临时CEO——视频流媒体网站Twit...

人工智能 2023-11-21 人工智能

686阅读

由浅入深理解Latent Diffusion/Stable Diffusion(3)：一步一步搭建自己的Stable Diffusion Models

Diffusion Models专栏文章汇总：入门与实战前言：关于如何使用stable diffusion的文章已经够多了，但是由浅入深探索stable diffusion models背后原理，如何在自己的科研中运用stable diff...

AIGC 2023-11-21 人工智能

656阅读

Ubuntu llama 2搭建及部署，同时附问题与解决方案

本机环境： AMD Ryzen7480 OH with Radeon Graphics(16 CPUs ,~2.9GHz Card name: NVIDIA GeForce RTX 2060 虚拟机环境：内存：4G 存储：100G 一、搭建...

大数据 2023-11-21 人工智能

1459阅读

英伟达 nvidia 官方code llama在线使用

新一代编程语言模型Code Llama面世：重新定义编程的未来随着人工智能和机器学习技术的迅速发展，我们现在迎来了一款革命性的大型编程语言模型——Code Llama。该模型是基于Llama 2研发的，为开放模型中的佼佼者，其性能达到了行业领先水平。...

大数据 2023-11-21 人工智能

812阅读

GPT-4V医学执照考试成绩超过大部分医学生，AI加入临床还有多远？

人工智能（AI）在医学影像诊断方面的应用已经有了长足的进步。然而，在未经严格测试的情况下，医生往往难以采信人工智能的诊断结果。对于他们来说，理解人工智能根据医学影像给出的判别，需要增加额外的认知成本。为了增强医生对辅助医疗的人工智能之间的信任，让 AI...

生成式AI 2023-11-21 人工智能

724阅读

基于llama模型进行增量预训练

目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...

生成式AI 2023-11-21 人工智能

1117阅读

Grounding dino + segment anything + stable diffusion 实现图片编辑

目录总体介绍总体流程模块介绍目标检测： grounding dino 目标分割：Segment Anything Model (SAM 整体思路模型结构：数据引擎图片绘制集成样例其他问题附录总体介绍...

生成式AI 2023-11-21 人工智能

1854阅读

【OpenAI】DALL·E 2，让我来带你认识一下这位来自AI界的艺术家

个人主页：【?个人主页】文章目录前言什么是DALL-E 2 ？介绍的怎么厉害，它又能干啥呢？基本功能新功能编辑变体功能总结前言 DALL-E 2 是一种基于语言的人工智能图像生...

大数据 2023-11-21 人工智能

853阅读

深入理解LLaMA, Alpaca, ColossalChat 系列模型

知乎：紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca：大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...

AIGC 2023-11-21 人工智能

842阅读

大语言模型之七- Llama-2单GPU微调SFT

（T4 16G）模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener...

人工智能 2023-11-21 人工智能

827阅读

中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT

中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型（LLM）。该模型基于封神榜团队的 Ziya2-13B 模型构建，拥有130亿个参数，并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...

生成式AI 2023-11-20 人工智能

740阅读

【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」

ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案中...

AIGC 2023-11-20 人工智能

1678阅读

OpenAI安全系统负责人长文梳理：大模型的对抗攻击与防御

随着 ChatGPT 的发布，大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源，研究如何在对齐过程中为模型构建默认的安全行为。但是，对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。目前在对抗攻击...

生成式AI 2023-11-20 人工智能

965阅读

揭秘百度文心一言大模型：设计、应用与实战

导言在当今的深度学习领域，大型预训练模型如GPT、BERT等已经取得了显著的进展。而百度公司的文心一言大模型，作为一款基于Transformer结构的巨型模型，也在自然语言处理领域产生了重大影响。本文将详细介绍文心一言大模型的设计原理、特点以及应用场...

人工智能 2023-11-20 人工智能

1310阅读

「无需配对数据」就能学习！浙大等提出连接多模态对比表征C-MCR

多模态对比表示（multi-modal contrastive representation, MCR）的目标是将不同模态的输入编码到一个语义对齐的共享空间中。随着视觉-语言领域中CLIP模型的巨大成功，更多模态上的对比表征开始涌现出来，并在诸多下游任...

人工智能 2023-11-20 人工智能

738阅读

GitHub Copilot使用指南

GitHub Copilot 是由 GitHub 开发的 AI 编程插件，GitHub Copilot 由 OpenAI Codex 提供支持，OpenAI Codex 是一种由 OpenAI 创建的生成式预训练语言模型，可根据评论和代码的上下文提供上下文...

人工智能 2023-11-20 人工智能

1437阅读

获得GitHub Copilot并结合VS Code使用

一·、什么是GitHub Copilot GitHub Copilot是一种基于AI的代码生成工具。它使用OpenAI的GPT（生成式预训练Transformer）技术来提供建议。它可以根据您正在编写的代码上下文建议代码片段甚至整个函数。要使用Gi...

人工智能 2023-11-19 人工智能

817阅读

LLaMA长度外推高性价比trick：线性插值法及相关改进源码阅读及相关记录

前言最近，开源了可商用的llama2，支持长度相比llama1的1024，拓展到了4096长度，然而，相比GPT-4、Claude-2等支持的长度，llama的长度外推显得尤为重要，本文记录了三种网络开源的RoPE改进方式及相关源码的阅读。关于长...

生成式AI 2023-11-19 人工智能

1002阅读

SDXL-Stable Diffusion改进版

文章目录 1. 摘要 2. 算法： 2.1 结构： 2.2 微小的条件机制 2.3 多宽高比训练 2.4 改进自编码器 2.5 所有组合放到一起 2.6 主流方案比较 3. 未来工作 4. 限制论文：《SDXL: Improv...

大数据 2023-11-19 人工智能

1161阅读

文心一言发布我怎么看?

文心一言发布我怎么看? 文心一言发布会我只简短的回答两个问题: 补充：文心一言发布会有想看发布会视频的朋友,关注爱书不爱输的程序猿,私信找我拿我只简短的回答两个问题: 1.文心一言能否为百度止颓？...

人工智能 2023-11-19 人工智能

741阅读

AIGC：【LLM（一）】——LoRA微调加速技术

文章目录一.微调方法 1.1 Instruct微调 1.2 LoRA微调二.LoRA原理三.LoRA使用一.微调方法 Instruct微调和LoRA微调是两种不同的技术。 1.1 Instruct微调 Instr...

AIGC 2023-11-19 人工智能

1509阅读

stable diffusion实践操作-常见lora模型介绍

系列文章目录本文专门开一节写Lora相关的内容，在看之前，可以同步关注：stable diffusion实践操作文章目录系列文章目录前言一、什么是lora? 1.1 lora 定义 1.2 lora的基本原理 1.2 通...

大数据 2023-11-18 人工智能

2409阅读

暂停ChatGPT Plus注册，OpenAI面临容量挑战

11月16日消息，据外媒报道，OpenAI首席执行官Sam Altman日前表示，DevDay开发者大会之后，ChatGPT的使用量激增，这给ChatGPT带来了容量挑战。对此，OpenAI决定暂时停止ChatGPT Plus的注册，以解决这些问题，并...

人工智能 2023-11-18 人工智能

642阅读

大模型「幻觉」，看这一篇就够了

大模型“幻觉”，终于有系统综述了！一口气49页，详细阐述了幻觉定义、分类、导致幻觉的原因，还有检测幻觉、减轻幻觉的方法。这篇最新综述来自哈工大和华为，一po出就在网上火得不行：具体来说，文中用一套新的范畴框架来定义模型幻觉，并将其分为事实性幻觉、...

AIGC 2023-11-18 人工智能

851阅读

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷，并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...

人工智能 2023-11-18 人工智能

783阅读

13B模型全方位碾压GPT-4？这背后有什么猫腻

一个参数量为 13B 的模型竟然打败了顶流 GPT-4？就像下图所展示的，并且为了确保结果的有效性，这项测试还遵循了 OpenAI 的数据去污方法，更关键的是没有发现数据污染的证据。如果你细细查看图中的模型，发现只要带有「rephraser」这个单词...

大数据 2023-11-18 人工智能

701阅读

写作AI软件哪个好用？安利三个AI写作生成器

曾经，写作是一项需要长时间学习和不断磨练的技能。但如今，随着写作AI软件的出现，任何人都可以轻松地创造出优秀的文章。这些软件通过深度学习算法和自然语言处理技术，将人工智能与写作完美结合，让写作变得更加简单高效。那你们知道写作AI软件哪个好用吗？下面...

AIGC 2023-11-18 人工智能

685阅读

基于文档的智能问答系统

基于文档的问答系统（Document-Based Question Answering System）是一种自然语言处理技术，用于回答用户提出的问题。它的原理是通过分析文档中的内容，提取出与用户问题相关的信息，并将其转换成可回答问题的格式。 ChatGP...

人工智能 2023-11-18 人工智能

674阅读

Meta生成式AI连放大招：视频生成超越Gen-2，动图表情包随心定制

提到视频生成，很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚，Meta 宣布，他们的视频生成效果超过了这两家，而且编辑起来还更加灵活。这个「吹小号、跳舞的兔子」是 Meta 发布的最新 demo。从中可以看出，Meta 的技术既支...

大数据 2023-11-18 人工智能

699阅读

Stable Diffusion 原理介绍与源码分析（一）

Stable Diffusion 原理介绍与源码分析（一）文章目录 Stable Diffusion 原理介绍与源码分析（一）前言（与正文无关，可以忽略）总览说明 Stable Diffusion 整体框架重要论文重要组成...

大数据 2023-11-17 人工智能

1247阅读

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：

一、下载示例 from huggingface_hub import snapshot_download repo_id = "THUDM/chatglm2-6b" local_dir = './chatglm2-6b/' cache_dir = l...

大数据 2023-11-17 人工智能

1073阅读

LLaMA-7B微调记录

Alpaca（https://github.com/tatsu-lab/stanford_alpaca）在70亿参数的LLaMA-7B上进行微调，通过52k指令数据（https://github.com/tatsu-lab/stanford_alpaca/...

大数据 2023-11-17 人工智能

930阅读

什么是 AIGC，只能用于 AI 绘画吗？

2023 年，像是技术井喷的一年，在上半年的时间里，尤其是人工智能领域，大模型 ChatGPT 的爆火，随之让普罗大众了解到 AIGC（Artificial Intelligence Generated Content，生成式人工智能），但对于 AIGC...

生成式AI 2023-11-17 人工智能

726阅读

Insight量子位智库 ✪ AIGC/Al生成内容产业展望报告

AIGC全称为 Al-Generated Content，指基于生成对抗网络GAN、大型预训练模型等人工智能技术，通过已有数据寻找规律，并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media，合成式媒体，主要指基...

大数据 2023-11-17 人工智能

815阅读

【NLP】Llama & Alpaca大模型

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

生成式AI 2023-11-17 人工智能

719阅读

AIGC：使用bert_vits2实现栩栩如生的个性化语音克隆

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型，...

AIGC 2023-11-17 人工智能

1440阅读

英伟达预告新版 TensorRT-LLM：推理能力飙升 5 倍、8GB 以上显卡可本地运行，支持 OpenAI 的 Chat API

11 月 16 日消息，微软 Ignite 2023 大会已于今天拉开帷幕，英伟达高管出席本次大会并宣布更新 TensorRT-LLM，添加了对 OpenAI Chat API 的支持。 IT之家今年 10 月报道，英伟达面向数据中心和 Windows...

大数据 2023-11-16 人工智能

712阅读

【2023云栖】黄博远：阿里云人工智能平台PAI年度发布

本文根据2023云栖大会演讲实录整理而成，演讲信息如下：演讲人：黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人演讲主题：阿里云人工智能平台PAI年度发布 AIGC是我们这个时代的新机遇今年云栖大会，阿里云机器...

大数据 2023-11-16 人工智能

794阅读

【大模型系列 06】LLaMA-7B/13B for PyTorch 昇腾迁移

源码链接 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/PyTorch/built-in/foundation/LLaMA-13B LLaMA-7B/13B for PyTorch...

AIGC 2023-11-16 人工智能

861阅读