gpu 第21页 - AIGC资讯

【MacOS】openai 语音识别模型 whisper 本地部署教程（cpu+mps方案）

目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程安装homebrew 安装Python （不要超过3.10）安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项可...

人工智能 2024-03-04 人工智能

3039阅读

只需少量计算和内存资源即可运行的小型 Llama 大模型

背景介绍在当今这个数据爆炸的时代，语言模型的训练变得越来越复杂和困难。我们需要巨大的计算资源和时间来训练一个高效的语言模型。然而，这对许多人来说并不现实。与此同时，我们也遇到了如何在有限的内存和计算资源中使用大型语言模型的挑战，特别是在边缘设备上。今...

生成式AI 2024-03-04 人工智能

845阅读

ControlNet作者又出新作：百万数据训练，AI图像生成迎来图层设计

尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础，但令人惊讶的是，分层内容生成或透明图像（是指图像的某些部分是透明的，允许背景或者其他图层的图像通过这些透明部分显示出来）生成领域获得的关注极少。这与市场的实际需求形成了鲜明对比。大多数视觉内容编辑...

生成式AI 2024-03-04 人工智能

828阅读

Stable diffusion 安裝使用

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusib UI**github：stable-diffusion-webui下載，**全程最好科學上網 1.無需下載git 可直接 Cod...

大数据 2024-03-03 人工智能

849阅读

用code去探索理解Llama架构的简单又实用的方法

除了白月光我们也需要朱砂痣我最近也在反思，可能有时候算法和论文也不是每个读者都爱看，我也会在今后的文章中加点code或者debug模型的内容，也许还有一些好玩的应用demo，会提升这部分在文章类型中的比例今天带着大家通过代码...

生成式AI 2024-03-03 人工智能

931阅读

AI测试｜Windows下跑起大模型（Llama）操作笔记

2024软件测试面试刷题，这个小程序（永久刷题），靠它快速找到工作了！（刷题APP的天花板）_软件测试刷题小程序-CSDN博客文章浏览阅读2.5k次，点赞85次，收藏11次。你知不知道有这么一个软件测试面试的刷题小程序。里面包含了面试常问的软件测试基础题，...

生成式AI 2024-03-03 人工智能

1072阅读

AI绘画 | Midjourney快速入门手把手教你生成第一张AI绘画

本文适合刚刚注册好Discor账号，且已购买了Midjourney服务的同学，如果还没注册或者购买服务的同学请网上查找相关资料目录: 1.登录Discord 2.认识Discord操作界面 3.怎么输入midjourney命令？ 4.生成第一张AI绘...

生成式AI 2024-03-03 人工智能

1168阅读

过年这些天② | 字节老矣，尚能饭AIGC？魅族与OPPO梭哈AI手机；AIGC红包封面花活儿大赏；Sam寻求7万亿芯片融资所图甚大；史上AI含量最高的春晚

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 春节：史上AI含量最高的春晚；把AIGC红包封面玩出花；支付宝集五福的AI元素；决战拜年之巅AI应用火了一把…… 龙年春晚看了吗？是不是感...

人工智能 2024-03-02 人工智能

907阅读

LLaMA-Factory 基于docker的大模型多卡分布式微调

LLaMA-Factory是一个相当优秀的微调工具。这里提供一个dockerfile和一个train脚本，用于多卡微调，供大家参考。 Dockerfile FROM nvidia/cuda:12.1.0-cudnn8-devel-ubuntu22.0...

人工智能 2024-03-02 人工智能

1507阅读

小扎宣布进军AGI！Meta正在训练Llama 3，目标是60万块H100！模型仍会开源

今日，扎克伯格在Instagram上通过一则视频官宣，Meta要进军AGI了！扎克伯格认定Meta的长期愿景是构建通用智能，将其负责任地开源，使其广泛可用并造福全人类，扎克伯格还透露了以下几点信息： 1、将两大 AI 研究团队 FAIR 和...

生成式AI 2024-03-02 人工智能

920阅读

一些安装AUTOMATIC1111的Stable Diffusion WebUI常遇到的错误消息的解决方式

确保电脑符合Stable Diffusion的系统需求 1. 电脑硬件需求最低配备建议配备注解显卡(GPU GTX1050Ti RTX3060Ti 支持的显卡芯片有Nvidia/AMD/Intel Arc/Apple M。显...

大数据 2024-03-02 人工智能

1387阅读

AIGC下一步：如何用AI再度重构或优化媒体处理？

让媒资中“沉默的大多数”再次焕发光彩。邹娟｜演讲者编者按 AIGC时代下，媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击，如何优化或重构媒体内容生产技术架构？在多样的应用场景中媒体内容生产技术又有着怎样的实践效...

人工智能 2024-03-01 人工智能

857阅读

英伟达CEO呼吁建立主权AI基础设施

人工智能(AI 热潮将英伟达(Nvidia 的股价推至历史新高。英伟达的GPU是支持人工智能工作负载的重要硬件。该公司的崛起也使得英伟达创始人兼首席执行官黄仁勋在人工智能市场上的影响力更大。在最近的迪拜世界政府峰会上，黄仁勋分享了他的观点，即每个国家...

大数据 2024-03-01 人工智能

809阅读

Stable Diffusion 3正式发布，旨在巩固其在AI图像领域相对于Sora和Gemini的领先地位

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

AIGC 2024-03-01 人工智能

836阅读

字节万卡集群技术细节公开：2天搞定GPT-3训练，算力利用率超英伟达Megatron-LM

随着对Sora技术分析的展开，AI基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注：文章披露，字节搭建起的万卡集群，能在1.75天内完成GPT-3规模模型（175B）的训练。具体来说，字节提出了一个名为MegaScale的生产系...

大数据 2024-03-01 人工智能

858阅读

Stable Diffusion——见识一下正在兴起的AIGC产业！

今天再水一天，转发一篇分享文明后天我会发布关于个人靶场搭建和内网穿透的内容，大家可以关注一下原文地址：Stable Diffusion——见识一下正在兴起的AIGC产业！ – Pleasure的博客下面是正文部分：前言你或许曾在...

大数据 2024-03-01 人工智能

909阅读

如何在 MacBook Pro 上安装 LLama.cpp + LLM Model 运行环境

如何在 MacBook Pro 上安装 LLama.cpp + LLM Model 运行环境 1. 问题与需求近段时间想学习一下大语言模型的本地化部署与应用。首先遇到的就是部署硬件环境的问题。我自己的笔记本是一台 MacBook Pro M3，没...

AIGC 2024-03-01 人工智能

1892阅读

在autodl搭建stable-diffusion-webui+sadTalker

本文介绍在autodl.com搭建gpu服务器，实现stable-diffusion-webui+sadTalker功能，图片+音频可生成视频。 autodl租GPU 自己本地部署SD环境会遇到各种问题，网络问题（比如...

大数据 2024-03-01 人工智能

1473阅读

Think2Drive：首个用于自动驾驶的基于模型的RL方法（上海交大）

本文经自动驾驶之心公众号授权转载，转载请联系出处。在CARLA v2中以专家级的熟练程度运行。题目：Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World...

人工智能 2024-02-29 人工智能

935阅读

基于神经网络的偏微分方程求解器新突破：北大&字节研究成果入选Nature子刊

近年来，基于神经网络的偏微分方程求解器在各领域均得到了广泛关注。其中，量子变分蒙特卡洛方法（NNVMC）在量子化学领域异军突起，对于一系列问题的解决展现出超越传统方法的精确度 [1, 2, 3, 4]。北京大学与字节跳动研究部门 ByteDance Re...

大数据 2024-02-29 人工智能

884阅读

想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

作为 2024 开年王炸，Sora 的出现树立了一个全新的追赶目标，每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。根据 OpenAI 披露的技术报告，Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式，并通过 Tr...

人工智能 2024-02-29 人工智能

899阅读

用GGUF和Llama .cpp量化Llama模型

用GGUF和Llama .cpp量化Llama模型什么是GGML 如何用GGML量化llm 使用GGML进行量化 NF4 vs. GGML vs. GPTQ 结论由于大型语言模型（LLMS）的庞大规模，量化已成为有效运行它们的必要...

大数据 2024-02-29 人工智能

1964阅读

英伟达发布Nemotron-4:150亿参数通用大模型，目标单张A100/H100可跑

英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数，经过在8T token上的训练，在英语、多语言和编码任务中表现出色。具体而言，Nemotron-4在7个评估基准上的15B模型表现优异，超越同等参数规模的模型，甚至击...

人工智能 2024-02-29 人工智能

881阅读

【直播预告】程序员逆袭CEO分几步？

2024年，是充满未知和挑战的一年。AI 的发展日新月异，已经有人用它来写代码了，啥时候会替代程序员，可真不好说。另一方面，程序员扎堆的 IT 互联网行业却进入了平台期甚至下行期，降本增效成为行业主流，裁员缩招的声音不绝于耳。在这种前有狼后有虎的年头，作为...

AIGC 2024-02-29 人工智能

779阅读

研究人员开发AI攻击方法BEAST：可在一分钟内绕过LLM防护栏

研究人员在美国马里兰大学成功开发了一种高效的方法，可以在一分钟内诱导大型语言模型（LLM）产生有害反应，他们将这一技术命名为BEAST(BEAm Search-based adversarial aTtack 。BEAST技术利用Nvidia RTX A6...

AIGC 2024-02-29 人工智能

974阅读

英伟达最强通用大模型Nemotron-4登场！15B击败62B，目标单张A100/H100可跑

最近，英伟达团队推出了全新的模型Nemotron-4，150亿参数，在8T token上完成了训练。值得一提的是，Nemotron-4在英语、多语言和编码任务方面令人印象深刻。论文地址：https://arxiv.org/abs/2402.1681...

AIGC 2024-02-29 人工智能

870阅读

微软6页论文爆火：三进制LLM，真香！

这就是由微软和中国中科院大学在最新一项研究中所提出的结论—— 所有的LLM，都将是1.58 bit的。具体而言，这项研究提出的方法叫做BitNet b1.58，可以说是从大语言模型“根儿”上的参数下手。将传统以16位浮点数（如FP16或BF16）形...

人工智能 2024-02-29 人工智能

808阅读

解锁SLAM新纪元！基于NeRF和3D GS方法综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在过去的二十年里，SLAM领域的研究经历了重大的发展，突出了其在实现未知环境的自主探索方面的关键作用。这种演变从手工制作的方法到深度学习时代，再到最近专注于神经辐射场...

人工智能 2024-02-29 人工智能

1253阅读

如何免费使用Lightning AI Studio

译者 | 布加迪审校 | 重楼我们在本文中将学习一个新的云IDE，它既免费又易于使用。它是Google Colab的升级版，允许你保存项目、使用必要的插件，并在GPU上免费运行生成式模型。 Lightning AI Studio简介 Light...

生成式AI 2024-02-29 人工智能

1127阅读

windows 下跑起大模型（llama）操作笔记

原贴地址：https://testerhome.com/topics/39091 前言国内访问 chatgpt 太麻烦了，还是本地自己搭一个比较快，也方便后续修改微调啥的。之前 llama 刚出来的时候在 mac 上试了下，也在 windows...

AIGC 2024-02-29 人工智能

1073阅读

老黄祭出全新RTX 500 GPU，AIGC性能狂飙14倍！AI应用的门槛彻底被打下来了

在巴塞罗那举行的世界移动大会（MWC 2024）上，英伟达发布了最新款的入门级移动版工作站GPU，RTX 500 Ada和RTX 1000 Ada。这两款入门级移动工作站GPU与之前发布的RTX 2000、3000、3500、4000和5000一起，构...

生成式AI 2024-02-28 人工智能

985阅读

生成式AI能拯救电信行业吗？

在日前正在举办的MWC 2024大会上，英伟达发布了一系列公告，其中包括与ARM、ServiceNow和软银的合作，成立AI-RAN联盟，以及与挪威电信达成一项重大协议，该协议将使挪威电信获得英伟达最新的硬件和企业AI软件，以支持其运营中采用的许多人工...

大数据 2024-02-28 人工智能

748阅读

了解一下CPU 、TPU、GPU、DPU、QPU

随着AI的火爆，CPU 、TPU、GPU、DPU、QPU这些缩略词整天在各种媒体里面飞来飞去。本文主要解释这些处理器，以及他们的优缺点。 CPU（中央处理器） CPU就像计算机的“大脑”。它能够处理计算机工作的所有基本任务，例如：运行程序、管理文件和执行...

大数据 2024-02-28 人工智能

957阅读

Sora阴影之下，焦虑的中国AI

“跟不上的可能就要被淘汰了。”看到Sora演示视频后，从业10多年的动画制作师黄斌得出了这样的判断。随着影视业失业潮呼声渐起，Sora的诞生也给中国AI行业带来了巨大的焦虑。 360集团创始人周鸿祎认为，Sora模型展现出了超越当前中国同类产品的性能...

AIGC 2024-02-28 人工智能

794阅读

千卡利用率超98%，详解JuiceFS在权威AI测试中的实现策略

2023 年 9 月，AI 领域的权威基准评测 MLPerf 推出了 Storage Benchmark。该基准测试通过模拟机器学习 I/O 负载的方法，在不需要 GPU 的情况下就能进行大规模的性能压测，用以评估存储系统的在 AI 模型训练场景的适用性。...

AIGC 2024-02-28 人工智能

839阅读

真快！几分钟就把视频语音识别为文本了，不到10行代码

大家好，我是风筝将音视频文件中的音频转为文字内容，这个需求放到两年前还不大好实现，但是放到今天，几分钟就解决了。听说有的公司为了抓取训练数据，已经把抖音、快手这些短视频平台上的视频扒了个遍，然后将其中的音频提取成文本，用作大数据模型的训练语料。如果...

AIGC 2024-02-28 人工智能

1443阅读

端侧最强，Meta田渊栋等人卷10亿以下参数小模型，LeCun：小技巧启动

「在移动设备上运行 LLM？可能需要 Meta 的一些技巧。」刚刚，图灵奖得主 Yann LeCun 在个人社交平台表示。他所宣传的这项研究来自 Meta 最新论文《 MobileLLM: Optimizing Sub-billion Paramet...

大数据 2024-02-27 人工智能

812阅读

【llm 微调code-llama 训练自己的数据集一个小案例】

这也是一个通用的方案，使用peft微调LLM。准备自己的数据集根据情况改就行了，jsonl格式，三个字段：context, answer, question import pandas as pd import random import...

AIGC 2024-02-27 人工智能

878阅读

MyShell AI开发高质量语音合成工具MeloTTS 支持中英混合发音

MeloTTS是由MyShell AI开发的一个高质量的多语言文本到语音（TTS）库。这个库支持英语、西班牙语、法语、中文、日语和韩语等多种语言，使其在全球范围内具有广泛的应用价值。项目地址:https://top.aibase.com/tool/me...

AIGC 2024-02-27 人工智能

910阅读

高通推出AI Hub，方便开发者在设备上访问和下载AI模型

随着在个人设备上的设备 AI 变得更加普及。在世界移动通信大会上，高通推出了一款工具AI Hub，简化了开发人员如何将 AI 模型直接下载到测试设备上的过程。新的高通 AI Hub 包含了一个库，其中包含超过75个生成式 AI 模型，开发人员可以轻松地...

AIGC 2024-02-27 人工智能

953阅读

高性能 LLM 推理框架的设计与实现

一、大语言模型推理概要介绍与传统的 CNN 模型推理不同，大语言模型的推理通常会分成 prefill 和 decoding 两个阶段。每一个请求发起后产生的推理过程都会先经历一个 Prefill 过程，prefill 过程会计算用户所有的输入，并生...

AIGC 2024-02-26 人工智能

1153阅读

到2026年，人工智能和加密货币将使数据中心的能源消耗翻倍

根据国际能源署(IEA 最近的一份报告，到2026年，数据中心的能源使用量有可能翻倍。 IEC预测，到2026年，数据中心的总耗电量将达到1000太瓦时以上。报告称：“这一需求大致相当于日本的用电量。”因此，更新的法规和技术改进，包括效率方面的改进，...

大数据 2024-02-26 人工智能

778阅读

【AI】Chinese-LLaMA-Alpaca-2 1.3B 7B 13B llama.cpp 量化方法选择及推理结果测试 x86_64 RTX 2060 6G 生成程序源码测试

1.3B Q4_0 (很快，没用 llm_load_print_meta: model type = ?B llm_load_print_meta: model ftype = Q4_0 llm_load_print_meta:...

生成式AI 2024-02-26 人工智能

876阅读

首席分析师揭秘爆火Groq，每小时要烧168美元！10倍H100拥有成本，老黄笑而不语

最近爆火的AI初创公司Groq，推出了比目前常见GPU推理系统快4倍，成本低70%的大模型推理解决方案。他们提供的运行Mistral Mixtral 8x7b的API演示，让大部分习惯了其他LLM「娓娓道来」的用户直呼，简直是魔法！ Groq在处理...

人工智能 2024-02-26 人工智能

833阅读

人工智能和数据中心：为什么人工智能如此需要资源

到2023年底，对生成式人工智能将需要多少能源的任何预测都是不准确的。例如，头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万户家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，每机架的功率密度将上升到50kW或1...

生成式AI 2024-02-26 人工智能

835阅读

AI崛起加剧数据中心能源消耗，谷歌新技术或帮助减排

2月26日消息，科技巨头正竞相加紧努力拆除被称为“碳定时炸弹”的隐患，随着人工智能（AI）技术的兴起，它们在全球建立的数据中心的能源消耗也急剧上升，进而导致的碳排放问题日渐严重。因此，谷歌引领的一项创新技术逐步受到重视：该技术通过软件在全球太阳能和风...

AIGC 2024-02-26 人工智能

764阅读

AIGC 实战：如何使用 Docker 在 Ollama 上离线运行大模型（LLM）

Ollama简介 Ollama 是一个开源平台，用于管理和运行各种大型语言模型 (LLM ，例如 Llama 2、Mistral 和 Tinyllama。它提供命令行界面 (CLI 用于安装、模型管理和交互。您可以使用 Ollama 根据您的需求下载...

AIGC 2024-02-26 人工智能

2095阅读

Stable Diffusion——stable diffusion基础原理详解与安装秋叶整合包进行出图测试

前言在2022年，人工智能创作内容（AIGC）成为了AI领域的热门话题之一。在ChatGPT问世之前，AI绘画以其独特的创意和便捷的创作工具迅速走红，引起了广泛关注。随着一系列以Stable Diffusion、Midjourney、NovelAI等...

AIGC 2024-02-24 人工智能

1082阅读

Stable Diffusion使用教程【InsCode Stable Diffusion美图活动一期】_inscode stable diffusion导入模型

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）记录一下如何使用 InsCode Stable Diffusion 进行 AI 绘图以及使用感受。一、背景介绍...

大数据 2024-02-24 人工智能

1351阅读

AI语音识别模块--whisper模块

1.下载 ffmpeg，挑一个自己电脑系统的版本，下载，如我win64：地址： Releases · BtbN/FFmpeg-Builds · GitHub 下载压缩包zip，到·本地解压安装，其实无需安装，只需把对应的目录下的bin，...

人工智能 2024-02-24 人工智能

1500阅读