gpu 第4页 - AIGC资讯

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork llama-cpu项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpu 在人工智能的广阔领域中，语言模型的进步一直是推动技术前沿的...

生成式AI 2024-09-06 人工智能

640阅读

AI绘画又有好玩的了，玩转FLUX，手和文字不再是问题了！

Prompt: Extreme close-up of a single tiger eye, direct frontal view. Detailed iris and pupil. Sharp focus on eye texture and col...

生成式AI 2024-09-06 人工智能

844阅读

stable Diffusion 网页用户界面 github

稳定的 Diffusion 网页用户界面使用 Gradio 库实现的稳定扩散的 Web 界面。特征带有图片的详细功能展示：原始的 txt2img 和 img2img 模式一键安装并运行脚本（但您仍然必须安装 pyth...

人工智能 2024-09-05 人工智能

741阅读

全球最大，马斯克4个月建成10万张H100超算集群！xAI算力超越OpenAI，奥特曼怕了

【新智元导读】两天前，马斯克得意自曝:团队仅用122天，就建成了10万张H100的Colossus集群，未来还会扩展到15万张H100和5万张H200。此消息一出，奥特曼都被吓到了:xAI的算力已经超过OpenAI了，还给员工承诺了价值2亿期权，这是要上天...

AIGC 2024-09-05 人工智能

645阅读

AIGC入门（二）从零开始搭建Diffusion！（下）

上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程（ForwardProcess.py）当我们的去噪器设计完成后，接下来，就...

人工智能 2024-09-05 人工智能

838阅读

本地搭建Stable Diffusion，文生图再也不用求别人了！

前言本地搭建Stable Diffusion，文生图再也不用求别人了 1. 简介 Stable Diffusion 是一种深度学习模型，用于生成高质量的图像。它基于一种名为扩散过程的生成方法，能够在给定条件的情况下生成具有丰富细节的图像。...

人工智能 2024-09-05 人工智能

771阅读

专为Windows 11 AI PC打造！高通推出全新骁龙X Plus 8核平台

快科技9月4日消息，高通公司总裁兼CEO安蒙在柏林国际电子消费品展览会（IFA）前夕，宣布扩展骁龙X系列产品组合，助力OEM推出700-900美元价格段的Windows 11 AIPC产品。官方介绍，骁龙X Plus 8核平台凭借定制的高通Oryon C...

大数据 2024-09-05 人工智能

590阅读

使用OpenAI Whisper的说话人识别管道

使用OpenAI Whisper的说话人识别管道 whisper-diarizationAutomatic Speech Recognition with Speaker Diarization based on OpenAI Whisper项目地址:...

AIGC 2024-09-05 人工智能

898阅读

大模型之二十七-语音识别Whisper实例浅析

Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型，目前支持99种语言，是目前性能最好的开源多语种识别ASR大模型，第一版版使用了68万小时标注好的语料预训练模型，而large-v3的标注数据超过了500万小时，其...

AIGC 2024-09-05 人工智能

1891阅读

如何在家用设备上运行 Llama 3.1 405B？搭建 AI 集群

在开放式 LLM 模型和封闭式 LLM 模型之间的竞争中，开放式模型的最大优势是您可以在本地运行它们。除了电力和硬件成本外，您无需依赖外部提供商或支付任何额外费用。但是，随着模型大小的增加，这种优势开始减弱。运行需要大量内存的大型模型并不容易。幸运的是，张...

AIGC 2024-09-04 人工智能

694阅读

AI日报：百度重磅发布智能“新搜索”；Luma新增镜头运动控制功能；ComfyUI图片转视频支持编辑表情；xAI上线全球最强AI训练系统Colossus

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、百度文心一言App全新升级为“...

大数据 2024-09-04 人工智能

643阅读

CVPR`24 | 又快又好！渲染速度比ENeRF快30倍！4K4D:实时4K分辨率4D视图合成

文章链接：https://arxiv.org/pdf/2310.11448 git链接： https://zju3dv.github.io/4k4d/ 本文旨在实现动态3D场景在4K分辨率下的高保真和实时视图合成。最近，一些动态视图合成方法在渲染质量方面...

生成式AI 2024-09-04 人工智能

649阅读

刚刚，英特尔发布最强CPU，AI PC迎来最高效x86芯片

最高效的x86芯片，应当是一种怎样的“打开方式”? 就在刚刚，英特尔给出了一份答案—— 英特尔®酷睿™Ultra200V系列处理器。话不多说，直接上亮点: 最快的CPU:E核比上一代快68%，P核则快了14% 最快的内置（built-in）GPU:首次...

大数据 2024-09-04 人工智能

598阅读

一夜蒸发2790亿美元！美国宣布对英伟达反垄断调查：AI芯片、显卡领域没对手

快科技9月4日消息，当地时间9月3日，美股低开低走，三大指数集体收跌，均创8月6日以来最大单日跌幅，而英伟达股价也是遭遇到了重创。英伟达跌超9%，市值大跌2789亿美元（约合人民币19861亿元），创4月下旬以来最大单日跌幅。当然了英伟达股价下跌，有多...

人工智能 2024-09-04 人工智能

503阅读

【AI绘画】ComfyUI 入门教程：安装 ComfyUI，AIGC新手入门教程

大家好，我是写编程的木木。 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面（GUI）。通过将不同的节点连接在一起，你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样： C...

AIGC 2024-09-04 人工智能

1047阅读

【实战】Llama3.1-部署与使用

大模型（LLM）狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型和科学计算大模型等。百模大战正值火热，开源 LLM 层出不穷。如今国内外已经涌现了众多优秀...

人工智能 2024-09-03 人工智能

910阅读

LLM之基于llama-index部署本地embedding与GLM-4模型并初步搭建RAG（其他大模型也可，附上ollma方式运行）

前言日常没空，留着以后写 llama-index简介官网：https://docs.llamaindex.ai/en/stable/ 简介也没空，以后再写注：先说明，随着官方的变动，代码也可能变动，大家运行不起来，可以进官网查查资料...

AIGC 2024-09-03 人工智能

2187阅读

NVIDIA GeForce RTX标志升级了！加入AI的力量

快科技9月3日消息，NVIDIA低调升级了其GeForce RTX”的标志，增加了一行小字Powering Advanced AI”，也就是打造先进AI”的意思。未来的RTX显卡，无论是零售包装盒，还是预装台式机、笔记本，都是打上这个标志。 GeForc...

大数据 2024-09-03 人工智能

590阅读

Llama 3.1 405B：4050亿参数史上最强开源大模型

01 。概述 Meta公司推出了其最大的开源人工智能模型——Llama 3.1 405B，拥有4050亿个参数，与GPT-4o和Claude 3.5 Sonnet相媲美。该模型在16000个Nvidia H100 GPU上训练而成，现已在云平台上可用，...

人工智能 2024-09-03 人工智能

770阅读

Stable-Diffusion1.5

SD1.5权重：https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main SDXL权重：https://huggingface.co/stabilityai/stable-diffus...

人工智能 2024-09-02 人工智能

888阅读

5 分钟 Stable Diffusion 本地安装指南

一、Stable Diffusion 简介 Stable Diffusion 是一款非常强大的基于深度学习的 AI 图像生成技术。它由众多研究团队和开发者共同努力而成，其中包括德国慕尼黑大学和总部位于纽约的 RunwayML 公司的国际研究团队。...

AIGC 2024-09-02 人工智能

825阅读

基于 Llama factory 微调 Llama3.1-70B-Chinese-Chat

本文旨在探讨基于Llama factory使用LoRA（Low-Rank Adaptation）技术对Llama3.1-70B-Chinese-Chat模型进行微调的过程，重点介绍在单机多卡和多机多卡两种分布式训练环境下的实现方法。 1.环境准备...

人工智能 2024-09-02 人工智能

836阅读

基于AIACC加速器快速实现Stable Diffusion生成特定物体图片

本文介绍如何使用GPU云服务器搭建Stable Diffusion模型，并基于ControlNet框架，快速生成特定物体图片。背景信息 Stable Diffusion（简称SD）是一种AI模型，它经过训练可以逐步对随机高斯噪声进行去噪以生成所需要的...

人工智能 2024-09-01 人工智能

683阅读

Mistral联合英伟达开源12B小模型：碾压Llama 3，单张4090可跑

小模型，成为本周的AI爆点。与动辄上千亿参数的大模型相比，小模型的优势是显而易见的:它们不仅计算成本更低，训练和部署也更为便捷，可以满足计算资源受限、数据安全级别较高的各类场景。因此，在大笔投入大模型训练之余，像 OpenAI、谷歌等科技巨头也在积极训...

大数据 2024-09-01 人工智能

648阅读

无需本地部署！免费使用开源大模型API

之前，我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说，给本地大模型添加知识库、API的调用等等。在这个过程中，有粉丝反馈自己不会部署，或者电脑配置不好，想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种...

生成式AI 2024-08-31 人工智能

4169阅读

WhisperX

文章目录一、关于 WhisperX 新闻 ? 二、设置⚙️ 1、创建Python3.10环境 2、安装PyTorch，例如Linux和Windows CUDA11.8： 3、安装此repo 4、Speaker Diarization 三、...

生成式AI 2024-08-31 人工智能

1301阅读

8G显存运行Llama 3.1 405B！

我正在接受挑战，在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB！这是 8GB VRAM 容量的 103 倍！显然，8GB VRAM 无法容纳它。那么我们如何让它工作呢？...

大数据 2024-08-31 人工智能

823阅读

【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起

前不久，Meta开源了LLaMA 3.1 405B【1】，模型扩展了上下文长度至 128K，支持八种语言，效果非常惊艳，是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型，已经赶上截至目...

生成式AI 2024-08-31 人工智能

826阅读

国内最大智算中心正式投用：每秒690亿亿次浮点运算可训练万亿参数大模型

快科技8月31日消息，日前，由中国移动承建的国内运营商最大单集群智算中心在哈尔滨正式运营。据悉，该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大等特点。单集群智算中心把所有AI加速卡打造成1个集群，用以支持千万亿级参数的大模型进行训练。这...

大数据 2024-08-31 人工智能

573阅读

DataWhale多模态赛事Task1

赛事链接：https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述：在当下大数据、大模型时...

生成式AI 2024-08-31 人工智能

600阅读

如何本地搭建Whisper语音识别模型

如何本地搭建Whisper语音识别模型如何本地搭建Whisper语音识别模型 1. 引言 Whisper模型简介本地搭建的意义和应用场景应用场景包括但不限于： 2. 环境准备系统要求 Python环境安装依赖库安装 3. 安...

AIGC 2024-08-31 人工智能

2045阅读

橙芯创想：香橙派AIPRO解锁升腾LLM与Stable Diffusion的创意密码

文章目录引言一. 香橙派AI PRO配置以及展示优秀的扩展能力实物展示二、Ascend-LLM模型部署开机 xshell连接香橙派实战运行部署运行结果分析开发版表现三、Stable Diffusion 文生图性能...

AIGC 2024-08-31 人工智能

961阅读

零成本部署秘籍：Llama 3本地使用全攻略，轻松实现高效模型运行！

Meta公司的Llama 3大模型引领AI新篇章各位朋友，我是袋鼠帝。近日，真正的“OpenAI”——Meta公司，对“Close AI”进行了有力回应，推出了其开源大模型系列的最新力作——Llama 3。自Llama 1起，这个系列便以其卓越性能在...

AIGC 2024-08-30 人工智能

690阅读

论文分析｜高效长文本生成的技术与应用

Preface 前言目前大模型公司很多在追求长文a本，对算力需求极大，如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长，它们在训练期间的内存需求呈指数级增加。语言模型训练的瓶颈在于显存占用非常大，这需要创...

生成式AI 2024-08-30 人工智能

660阅读

从零开始快速使用comfyUI进行文生图或者图生视频制作

前言今天花时间试了试怎么用 ComfyUI，今天晚上就来介绍一下，怎么简单使用。上面是用 comfyUI 生成的视频。安装首先进行安装。在 github 上搜索 comfyUI，第一个就是，点进去然后点击左侧 Release...

生成式AI 2024-08-30 人工智能

3049阅读

探索Llama 3.1 : 405B参数模型：部署、硬件配置、测试与训练的心得

引言随着人工智能技术的快速发展，大规模语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了显著的突破。MetaAI最新发布的Llama 3.1 : 405B参数模型，凭借其庞大的参数规模和先进的架构，展...

大数据 2024-08-30 人工智能

1800阅读

AIGC——微调技术(Datawhale X 魔搭 Al夏令营)

微调（Fine-tuning）是一种在深度学习和机器学习领域中常用的技术，旨在通过调整预训练模型的参数来使其更好地适应特定任务。其基本原理和参数的理解对于实现更好的效果至关重要。前言了解微调的基本原理，对微调的各种参数有一个更加清楚的了解，...

大数据 2024-08-30 人工智能

603阅读

llama.cpp使用

llama.cpp的github库地址为ggerganov/llama.cpp: LLM inference in C/C++ (github.com ，具体使用以官方说明为准。简介 llama.cpp目标是在本地和云端的各种硬件上以最小的设置和最...

AIGC 2024-08-29 人工智能

2281阅读

GPU云服务器------2秒文生图

GPU云服务器------2秒文生图 GPU云服务器 AIGC来也开通GPU服务配置安全组规则远程连接GPU云服务器配置nginx用户文生图开启AiaccTorch 禁用AiaccTorch 切换模型使用LoRA插件使用Con...

AIGC 2024-08-29 人工智能

600阅读

英伟达Blackwell称霸MLPerf！推理性能暴涨30倍，新一代「AI怪兽」诞生

【新智元导读】MLPerf Inference发布了最新测试结果，英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技，展现出明显的性能提升，甚至刷新了部分任务上的测试纪录。大语言模型（LLM）推理是一个全栈挑战。为了实现高吞吐量、低延迟的...

生成式AI 2024-08-29 人工智能

631阅读

ComfyUI基础篇：Windows系统安装ComfyUI方法

ComfyUI作为一款功能强大的AI生图工具，它通过节点方式，使用户可以直观地看到各个模块的功能，并根据需求进行调整和连接。这种方法使工作流程更加清晰，同时降低了使用门槛，使得不熟悉代码的用户也能轻松使用。本文记录ComfyUI在Windows的安装方法。...

AIGC 2024-08-29 人工智能

1340阅读

ubuntu系统编译whisper.cpp/talk-llama

1. 项目克隆到本地 git clone https://github.com/ggerganov/whisper.cpp 2. 编译 CPU 版本： sudo apt-get install libsdl2-dev cd whisper.cpp...

AIGC 2024-08-28 人工智能

619阅读

Whisper-Streaming：实时语音转写与翻译的革命性工具

Whisper-Streaming：实时语音转写与翻译的革命性工具 whisper_streamingWhisper realtime streaming for long speech-to-text transcription and transl...

AIGC 2024-08-28 人工智能

1302阅读

5分钟 Stable Diffusion 本地安装

5分钟 Stable Diffusion 本地安装 5分钟 Stable Diffusion 本地安装 1. 引言 1.1 什么是Stable Diffusion？ 1.2 本地安装的优势 2. 准备工作 2.1 系统要求 2.2 推荐...

人工智能 2024-08-28 人工智能

848阅读

大模型框架汇总：大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel

常见的大模型框架：大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel：大模型框架是指用于训练、推理和部署大型语言模型（LLMs）的软件工具和...

生成式AI 2024-08-28 人工智能

1345阅读

LLaMA3技术报告解读

前言 LLaMA系列算法是Meta公司发布的开源大模型。近期Meta公司又发布了LLaMA 3.1系列的模型，在这一系列模型中参数量最大的高达405B，上下文窗口多达128K个token。同时对模型进行了广泛的实证评估，发现在很多任务中，LLaMA 3...

生成式AI 2024-08-28 人工智能

1156阅读

4060显卡+LLaMA-Factory微调LLM环境准备——（一）安装cuda

本地配置系统：win10**硬件：**i5-12490f+RTX4060 安装原因：最近尝试在本地对开源LLM进行Fine-tune的时候，用到了LLaMA-Factory，在运行的时候，弹出未检测到GPU，后来才发现，是忘记安装cuda等...

AIGC 2024-08-27 人工智能

2175阅读

LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设

模型越来越大，需要的 GPU 越来越多；与此同时 GPU 性能也在不断增强，配套的网络带宽也不断增加到 400G（Blackwell GPU 甚至需要到 800 Gbps）。Ranking 模型还在迁移到 GPU 的早期阶段，但使用 GPU 的规模也在不断...

生成式AI 2024-08-27 人工智能

1001阅读

液冷技术：迎接AIGC时代数据中心的散热挑战

随着人工智能生成内容（AIGC）的跨越式发展，算力需求呈爆炸式增长，带动了数据中心的功耗和热管理需求的飞速上升。AI模型训练和推理过程中的高计算资源需求，导致服务器发热量大幅增加，对散热技术提出了更高的要求。根据Colocation America发布的数...

生成式AI 2024-08-27 人工智能

585阅读

使用FastChat快速部署LLM服务

原文：https://zhuanlan.zhihu.com/p/705915093 FastChat 是一个用于训练、服务和评估基于LLM的聊天机器人的开放平台，它的核心功能包括：最先进模型（例如 Vicuna、MT-Bench）的训练和评估代码。...

AIGC 2024-08-27 人工智能

810阅读