gpu 第42页 - AIGC资讯

llama.cpp一种在本地CPU上部署的量化模型（超低配推理llama）

0x00 背景前不久，Meta前脚发布完开源大语言模型LLaMA，随后就被网友“泄漏”，直接放了一个磁力链接下载链接。然而那些手头没有顶级显卡的朋友们，就只能看看而已了但是 Georgi Gerganov 开源了一个项目llama.cpp...

大数据 2023-11-10 人工智能

1112阅读

基于容器平台 ACK 快速搭建 Stable Diffusion

作者：子白本文介绍如何在阿里云容器平台 ACK 上快速搭建一套可对外提供服务的 Stable Diffusion。 CPU 版本前提条件已创建 Kubernetes 托管版集群。具体操作，请参见创建 Kubernetes 托管版集群[1]...

大数据 2023-11-10 人工智能

573阅读

Llama大模型运行的消费级硬件要求【CPU|GPU|RAM|SSD】

大型语言模型 (LLM 是强大的工具，可以为各种任务和领域生成自然语言文本。最先进的LLM之一是 LLaMA（大型语言模型 Meta AI），这是由 Facebook 的研究部门 Meta AI 开发的一个包含 650 亿个参数的模型要在家运行 L...

人工智能 2023-11-10 人工智能

2803阅读

LoRa模型训练教程（炼丹，Stable Diffusion）

1. lora介绍（Low Rank Adaption）何为LoRA？LoRA并不是扩散模型专有的技术，而是从隔壁语言模型（LLM）迁移过来的，旨在解决避免将整个模型参数拷贝下来才能对模型进行调校的问题。因为大型语言模型的参数量过于恐怖，比如最近新出...

AIGC 2023-11-10 人工智能

992阅读

使用 PAI-Blade 优化 Stable Diffusion 推理流程

背景 AIGC是人工智能计算领域里发展迅速的重要业务。Stable Diffusion 是其中最热门的开源模型，受到广泛关注。然而，随着应用场景不断扩大，Stable Diffusion所面临的推理时延和计算成本问题也越来越突出。简介 PAI-Bl...

人工智能 2023-11-10 人工智能

639阅读

解决stable diffusion webui1.6 wd1.4 tagger加载失败的问题

由于webui源码的变化，需要修改两个地方的import 1.tagger/ui.py # 第十行 # from webui import wrap_gradio_gpu_call # 原代码 from modules.call_queue imp...

大数据 2023-11-10 人工智能

806阅读

Windows10上使用llama-recipes(LoRA)来对llama-2-7b做fine-tune

刚刚在Windows10上搭建环境来对llama2做finetune，里面坑还是挺多的，这里把印象中的坑整理了一下以作备忘。 llama-recipes是meta的开源项目，Github地址为：GitHub - facebookresearch/llam...

大数据 2023-11-09 人工智能

627阅读

AI视野：ChatGPT和API发生重大中断；GPTs分阶段推出计划延迟；中国第二批11个大模型备案获批；阿里将开源720亿参数大模型

???AI新鲜事 ChatGPT和API发生重大中断! 11月9日凌晨，OpenAI在官网发布，ChatGPT和API发生重大中断，导致全球所有用户无法正常使用，宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复，但仍然不稳定，会继续进行安全监控...

生成式AI 2023-11-09 人工智能

652阅读

【原创】用 VisualGLM 进行AIGC多模识别和内容生成

最近几个月，整个AI行业的LLM（大语言模型）蓬勃发展，除了过去传统的纯文字的多模态能力的视觉语言模型，如 GPT-4，ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日，智谱...

人工智能 2023-11-09 人工智能

682阅读

ChatGPT 挂了一整天了，已经习惯了用大模型的我怎么办

OpenAI 挂了，已经习惯了用大模型的我怎么办 OpenAI 挂了，急，在线等。你是不是已经习惯了 ChatGPT 的存在？是不是感觉离了 ChatGPT 寸步难行，很难再进行自己的工作？今天 ChatGPT 大面积宕机，服务直到文章发布（下午5点...

大数据 2023-11-09 人工智能

821阅读

【AIGC】Baichuan2-13B-Chat模型微调

环境微调框架：LLaMA-Efficient-Tuning 训练机器：4*RTX3090TI (24G显存 python环境：python3.8, 安装requirements.txt依赖包一、Lora微调 1、准备数据集 2、训...

大数据 2023-11-09 人工智能

642阅读

大模型使用——超算上部署LLAMA-2-70B-Chat

大模型使用——超算上部署LLAMA-2-70B-Chat 前言1、本机为Inspiron 5005，为64位，所用操作系统为Windos 10。超算的操作系统为基于Centos的linux，GPU配置为A100，所使用开发环境为Anaconda。2、...

AIGC 2023-11-09 人工智能

625阅读

Meta最新模型LLaMA细节与代码详解

Meta最新模型LLaMA细节与代码详解 0. 简介 1. 项目环境依赖 2. 模型细节 2.1 RMS Pre-Norm 2.2 SwiGLU激活函数 2.3 RoPE旋转位置编码 3. 代码解读 3.1 tokenizer 3.2 m...

人工智能 2023-11-09 人工智能

651阅读

AI监管争议再起，华尔街对它的热情却丝毫未减

美国政府近期发布一项新的AI法规，也让世界再次把目光放到AI的安全疑虑问题上。对于开发大模型的公司来说，这项法规要求它们向政府提供更多信息，而这可能会减慢新产品和更新的发布速度。这项法规中的许多规定涉及尚未上市的大型基础模型和AI系统的未来发展，这就...

AIGC 2023-11-09 人工智能

538阅读

stable diffusion API 调用，超级详细代码示例和说明

本文主要介绍 stable diffusion API 调用，准确来说是对 stable diffusion webui 的 API 调用。接口文档可以查看： http://sd-webui.test.cn/docs 这里的 sd-webui...

人工智能 2023-11-09 人工智能

654阅读

Hugging Face 的 H4 两人团队正在开发类似 ChatGPT 的人工智能聊天机器人

人工智能初创企业 Hugging Face 近日宣布，其由两人组成的 H4 团队正致力于开发工具和「配方」，以帮助 AI 社区构建类似于 ChatGPT 的人工智能聊天机器人。自 ChatGPT 发布以来，H4 团队的成立便是为了复制其功能，使用开源库和模...

AIGC 2023-11-09 人工智能

594阅读

【AI画画教程】无整合包使用LoRA和Dreambooth训练全流程详解（Linux）

前言本教程遵循简单原则，不使用任何民间整合包。目前很多AI画画训练整合包臃肿复杂，教程也是名词乱炖，容易对初学者造成理解误差和使用困难。因为许多整合包都依赖于sd-scripts库，它自身就能支持绝大多数的训练场景，学会这个后，自己也可以根据自己...

人工智能 2023-11-09 人工智能

2203阅读

解决在Windows安装stable diffusion遇到“Torch is not able to use GPU”的问题

解决在Windows安装stable diffusion遇到“Torch is not able to use GPU”的问题遇到的问题解决方法参考链接遇到的问题在Windows上安装stable diffusion的最...

生成式AI 2023-11-09 人工智能

686阅读

OpenAI大佬甩出「喵喵GPT」调戏黑客！分享ChatGPT成功的秘密：极限压榨GPU资源

一个30人的团队，完成了这个地球上最受欢迎的产品的发布和维护。他们成功的经验和失败的教训，简直如金子一般珍贵。 OpenAI的工程团队经理（Engineering Manager）EvanMorikawa在一个开发者社区的活动中，分享了OpenAI发布Ch...

AIGC 2023-11-09 人工智能

592阅读

基于趋动云部署秋葉aaaki的Stable Diffusion整合包v4--linux版

B站大V秋葉aaaki的Stable Diffusion整合V4版发布了，集成度比较高，在windows下解压缩直接就可以使用，整合的非常好。但是笔人没有RTX4090这样级别的显卡，又希望有个高速运行的效果。所以索性到云GPU主机上来用秋叶aaaki...

人工智能 2023-11-09 人工智能

1262阅读

AI绘画——使用stable-diffusion生成图片时提示RuntimeError: CUDA out of memory处理方法

提示显存不足 RuntimeError: CUDA out of memory. Tried to allocate 1.50 GiB (GPU 0; 8.00 GiB total capacity; 5.62 GiB already alloc...

人工智能 2023-11-08 人工智能

679阅读

AIGC专栏7——EasyPhoto 人像训练与生成原理详解

AIGC专栏7——EasyPhoto 人像训练与生成原理详解学习前言源码下载地址为什么是Lora EasyPhoto的训练流程 1、数据的预处理 a、人像排序 i、人脸特征向量提取过程 ii、人脸偏移角度计算 iii、人像排序 b...

AIGC 2023-11-08 人工智能

728阅读

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】的简介、...

人工智能 2023-11-08 人工智能

837阅读

AIGC实战——深度学习 (Deep Learning, DL)

AIGC实战——深度学习 0. 前言 1. 深度学习基本概念 1.1 基本定义 1.2 非结构化数据 2. 深度神经网络 2.1 神经网络 2.2 学习高级特征 3. TensorFlow 和 Keras 4. 多层感知器 (MLP ...

大数据 2023-11-08 人工智能

593阅读

【AI绘画--七夕篇】：如何训练Lora模型打造令人惊叹的AI绘画

目录前言一、? 选择合适的云端平台 1-1、云端平台的优势 1-2、选择适合的云端平台二、? 账号注册三、? 开始炼丹 3-1、购买算力并创建工作空间 3-2、启动工作空间 3-3、应用市场一键安装四、? 使用Stable-D...

大数据 2023-11-08 人工智能

736阅读

中文大语言模型 Llama-2 7B（或13B）本地化部署（国内云服务器、GPU单卡16GB、中文模型、WEB页面TextUI、简单入门）

本文目的是让大家先熟悉模型的部署，简单入门；所以只需要很小的算力，单台服务器单GPU显卡（显存不低于12GB），操作系统需要安装 Ubuntu 18.04。 1 服务器&操作系统 1.1服务器的准备...

生成式AI 2023-11-08 人工智能

1135阅读

深度解析 Llama 2 的资源汇总：不容错过

“ 探索 Llama 2 背后的过程，包括了模型的全面解析，在线体验，微调，部署等，这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后，不少朋...

人工智能 2023-11-08 人工智能

730阅读

带你认识一下多模态对比语言图像预训练CLIP

本文分享自华为云社区《多模态对比语言图像预训练CLIP：打破语言与视觉的界限》，作者：汀丶。一种基于多模态（图像、文本）对比训练的神经网络。它可以在给定图像的情况下，使用自然语言来预测最相关的文本片段，而无需为特定任务进行优化。CLIP的设计类似于GP...

生成式AI 2023-11-08 人工智能

594阅读

微软携手风险投资公司，为初创企业提供免费AI芯片资源

在当前的AI芯片短缺情况下，微软宣布将向一些特权初创企业提供免费访问其Azure云的“超级计算”资源，用于开发AI模型。微软今天宣布将升级其初创企业计划“微软 for Startups Founders Hub”，以包括一个免费的Azure AI基础设施选...

大数据 2023-11-08 人工智能

570阅读

【LLM】Windows本地CPU部署民间版中文羊驼模型（Chinese-LLaMA-Alpaca）踩坑记录

目录前言准备工作 Git Python3.9 Cmake 下载模型合并模型部署模型前言想必有小伙伴也想跟我一样体验下部署大语言模型, 但碍于经济实力, 不过民间上出现了大量的量化模型, 我们平民也能体验体验啦~...

生成式AI 2023-11-08 人工智能

718阅读

【腾讯云 HAI域探秘】——自行搭建Stable Diffusion模型服务用于生成AI图片 | 自行搭建ChatGL M26BAI模型服务用于AI对话

自行搭建Stable Diffusion模型服务用于生成AI图片一、服务创建 1、服务地址：高性能应用服务HAI 新品内测 2、等待审核(大概24小时二、创建服务 1、新建服务 2、选择AI模型：Stable Diffus...

AIGC 2023-11-08 人工智能

622阅读

云原生应用 Kubernetes 监控与弹性实践

前言云原生应用的设计理念已经被越来越多的开发者接受与认可，而Kubernetes做为云原生的标准接口实现，已经成为了整个stack的中心，云服务的能力可以通过Cloud Provider、CRD Controller、Operator等等的方式从K...

生成式AI 2023-11-08 大数据

584阅读

【obs-studio开源项目从入门到放弃】windows 窗口采集和桌面采集的解决方案

文章目录前言窗口采集源和桌面采集源的注册窗口采集选择桌面采集方式 DXGI or WGC GDI 窗口采集原理 DXGI 窗口采集原理 WGC 窗口采集原理基于放大镜技术实现录屏采集总结技术参考前言 obs系列文...

AIGC 2023-11-08 大数据

2260阅读

迈创采集卡搭配工业相机二次开发介绍（一）

迈创采集卡搭配工业相机二次开发介绍（一）SDK简介迈创采集卡介绍迈创采集卡SDK简介 MIL SDK获取路径接口函数说明 MIL接口简单介绍迈创采集卡介绍 MIL全称为Matrox Imaging Library，由加...

生成式AI 2023-11-08 大数据

964阅读

从零开始入门 K8s | 可观测性：监控与日志

作者 | 莫源阿里巴巴技术专家一、背景监控和日志是大型分布式系统的重要基础设施，监控可以帮助开发者查看系统的运行状态，而日志可以协助问题的排查和诊断。在 Kubernetes 中，监控和日志属于生态的一部分，它并不是核心组件，因此大部分的能...

生成式AI 2023-11-08 大数据

573阅读

如何高效训练？综述汇总：大型深度学习训练的并行分布式系统

本文经自动驾驶之心公众号授权转载，转载请联系出处。 23年1月论文“Systems for Parallel and Distributed Large-Model Deep Learning Training“，来自UCSD。深度学习（DL）已经...

AIGC 2023-11-08 人工智能

622阅读

联发科发布天玑9300生成式AI移动芯片支持运行330亿参数大模型

昨日晚间，联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片，采用台积电第三代4nm 制程。该芯片预计于2023年底上市。这款芯片采用全大核架构设计，提供高智能、高性能、高能效、低功耗的特性，为用户带来卓越的生成式 AI 体验。天玑9300采...

AIGC 2023-11-07 人工智能

555阅读

GPU推理提速4倍！FlashDecoding++技术加速大模型推理

推理大模型（LLM）是AI服务提供商面临的巨大经济挑战之一，因为运营这些模型的成本非常高。FlashDecoding++ 是一种新的技术，旨在解决这一问题，它通过提高LLM推理速度和降低成本，为使用大模型赚钱提供了新的可能性。论文地址:https://...

人工智能 2023-11-06 人工智能

578阅读

AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

????大模型动态李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。项目地址:htt...

AIGC 2023-11-06 人工智能

657阅读

马斯克xAI公布大模型详细进展，Grok只训练了2个月

近几日，马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ，直接把网友的好奇心拉满。和总是一本正经回答问题的 ChatGPT 不同，Grok 自带幽默和嘲讽技能。就像下图所展示的，Grok 在被...

AIGC 2023-11-06 人工智能

626阅读

李开复称其创立的AI公司零一万物估值已超10亿美元发布大模型Yi-34B

此前，李开复成立了一家初创公司，名为零一万物（01.AI），旨在为中国市场开发本土大型语言模型（LLM）。日前，李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母，在中国显然存在巨大的需求。与世界其他地方不同，中国无法使用OpenAI和Go...

AIGC 2023-11-06 人工智能

566阅读

苹果M3全系列跑分曝光！16核Max反超24核M2 Ultra，战平英特尔AMD旗舰CPU

伴随着苹果的发布会，M3系列的芯片终于要跟随Mac的新品一起投入实战了。早在几个月前，M3的规格曝光之后，众人就纷纷进行各种猜测和「预言」。现在，M3在Geekbench 6中的跑分终于曝光，之前大家对其性能的各种讨论也尘埃落定。我们来看一下万众期...

AIGC 2023-11-05 人工智能

585阅读

AI生图太诡异？马里兰&NYU合力解剖神经网络，CLIP模型神经元形似骷髅头

AI黑盒如何才能解？神经网络模型在训练的时，会有些ReLU节点「死亡」，也就是永远输出0，不再有用。它们往往会被被删除或者忽略。恰好赶上了模糊了生与死的界限的节日——万圣节，所以这是探索那些「死节点」的好时机。对于大多数图像生成模型来说，会输出正...

人工智能 2023-11-03 人工智能

614阅读

大模型: 模型大了难在哪里？

大家好，我是Tim。自从GPT模型诞生以来，其参数规模就在不停的扩大。但模型并非简单的直接变大，需要在数据、调度、并行计算、算法和机器资源上做相应的改变。今天就来总结下，什么是大模型，模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...

人工智能 2023-11-03 人工智能

1267阅读

使用Ray创建高效的深度学习数据管道

用于训练深度学习模型的GPU功能强大但价格昂贵。为了有效利用GPU，开发者需要一个高效的数据管道，以便在GPU准备好计算下一个训练步骤时尽快将数据传输到GPU。使用Ray可以大大提高数据管道的效率。 1、训练数据管道的结构首先考虑下面的模型训练伪代码。...

AIGC 2023-11-02 人工智能

716阅读

英特尔AMD寄望AI PC提振业绩，但消费者有钱换新吗？

11月2日消息，经历了两年新冠肺炎疫情引发的增长后，个人电脑（PC）销售一直低迷。下滑幅度如此之大，以至于市场研究公司IDC公布的第三季度PC销售量同比下降7.6%算是一个显著的改善，因为此前连续五个季度的销量都在以两位数的速度下降。IDC预计今年全球...

人工智能 2023-11-02 人工智能

578阅读

OpenAI首席科学家：ChatGPT已经出现意识，人类未来将与AI融合

昨晚，「ChatGPT可能已经有了意识」的话题就上了微博热搜。 OpenAI的联合创始人兼首席科学家Ilya Sutskever在接受采访时表示，现在的首要任务已经不是制作下一个GPT或DALL·E，而是研究如何阻止超级AI的失控！他认为，ChatG...

AIGC 2023-11-02 人工智能

525阅读

会玩！一国外AI公司称要在海上训练强大的AI以规避美国法规

在美国总统拜登本周颁布关于人工智能技术的行政命令之后，一家公司宣布采取了非同寻常的措施，以避免新要求，即公司必须向政府报告是否正在培训一种强大的AI模型:将一批计算机硬件放在国际水域上的驳船上。自称是一家人工智能研究公司的Del Complex周一在X帖...

AIGC 2023-11-02 人工智能

579阅读

NVIDIA AI加速卡涨到43万元还得等1年！韩国Google被吓跑

NVIDIA AI GPU无疑是当下的抢手货，但一方面产能严重不足，另一方面价格不断飙升，让不少客户望而却步。当然，NVIDIA并不是唯一的选择，Intel、AMD也都有类似的方案。韩国头号搜索引擎Naver最近就转投了Intel。 Naver原本使用N...

AIGC 2023-11-01 人工智能

610阅读

AMD 下一代 APU 路线图更新：Strix Halo「Sarlak」推迟至 2025 年，AI 性能得到显著提升

近日，Moore’s Law Is Dead 分享了关于 AMD 下一代 APU 系列的最新消息。关键亮点是，被称为 Sarlak 或 Strix Halo 的产品现已被安排在 2025 年推出。此外，在 Phoenix 之后，Strix Point 将实...

AIGC 2023-11-01 人工智能

1093阅读