gpu - AIGC资讯

ai芯片的战争：gpu、tpu与专用架构

标题：AI芯片的战争：GPU、TPU与专用架构的较量随着人工智能技术的飞速发展，AI芯片作为支撑这一技术革命的关键基础设施，正经历着一场前所未有的竞争与变革。在这场没有硝烟的战争中，GPU（图形处理器）、TPU（张量处理单元）以及专用架构芯片各显神通，共同...

AIGC 2025-07-25 人工智能

1029阅读

ai与碳排放：大模型训练的能源消耗与优化路径

标题：AI与碳排放：大模型训练的能源消耗与优化路径随着人工智能（AI）技术的飞速发展，尤其是深度学习模型的广泛应用，AI系统已成为现代社会不可或缺的一部分，极大地推动了科技进步和产业升级。然而，AI大模型的训练过程对计算资源的需求极高，随之而来的是巨大的能...

生成式AI 2025-07-21 人工智能

1318阅读

神经架构搜索（nas）：自动化模型设计的未来

标题：神经架构搜索（NAS）：自动化模型设计的未来在人工智能领域，深度学习模型的性能往往与其架构设计紧密相关。传统上，设计高效的神经网络架构是一项既耗时又高度依赖于专家经验的任务。然而，随着计算能力的飞跃和算法创新的不断推进，神经架构搜索（Neural A...

AIGC 2025-07-19 人工智能

965阅读

存算一体技术：突破ai计算的“内存墙”

标题：存算一体技术：突破AI计算的“内存墙”随着人工智能（AI）技术的飞速发展，其在各个领域的应用日益广泛，从自动驾驶到智能医疗，从金融科技到物联网，AI正以前所未有的速度改变着我们的生活。然而，AI技术的快速发展也面临着巨大的挑战，其中之一便是“内存墙”...

人工智能 2025-07-18 人工智能

970阅读

ai芯片革命：从gpu到存算一体架构的跃迁

标题：AI芯片革命：从GPU到存算一体架构的跃迁在科技日新月异的今天，人工智能（AI）已成为推动社会进步与产业升级的关键力量。而在这场智能革命的背后，AI芯片作为核心驱动力，正经历着前所未有的变革。从早期的通用处理器（CPU）到图形处理器（GPU），再到如...

人工智能 2025-07-10 人工智能

847阅读

ai与硬件协同：从cpu到asic的定制化加速

标题：AI与硬件协同：从CPU到ASIC的定制化加速之旅随着人工智能（AI）技术的飞速发展，其在各行各业的应用日益广泛，从自动驾驶到医疗诊断，从智能客服到金融风控，AI正深刻改变着我们的生活方式和工作模式。然而，AI算法的复杂性和对计算资源的巨大需求，对底...

大数据 2025-06-30 人工智能

877阅读

ai与能源消耗：大模型训练的碳足迹争议

标题：AI与能源消耗：大模型训练的碳足迹争议在人工智能（AI）技术日新月异的今天，大型语言模型、深度学习网络等先进算法正以前所未有的速度推动着科技进步和社会变革。然而，随着这些AI大模型性能的不断提升，其背后隐藏的能源消耗问题也逐渐浮出水面，引发了广泛的争...

AIGC 2025-06-27 人工智能

1078阅读

人工智能的算力革命：gpu vs tpu

标题：人工智能的算力革命：GPU vs TPU在人工智能（AI）领域，算力是推动技术进步的核心动力。随着深度学习模型的不断复杂化，对计算资源的需求呈现出爆炸式增长。在这场算力革命中，图形处理器（GPU）和张量处理器（TPU）作为两大核心计算平台，各自以其独...

人工智能 2025-06-27 人工智能

905阅读

ai模型的轻量化：如何在移动端部署

标题：AI模型的轻量化：探索在移动端的高效部署策略随着人工智能技术的飞速发展，AI应用已经渗透到我们日常生活的方方面面，从智能语音识别到个性化推荐系统，无一不彰显着AI的魅力。然而，尽管服务器端AI模型能够处理复杂任务并提供高精度预测，但在移动端设备上部署...

大数据 2025-06-26 人工智能

895阅读

数据挖掘中的计算效率优化

数据挖掘作为现代数据分析的核心技术之一，旨在从海量、复杂的数据集中提取有价值的信息和知识。然而，随着数据量的爆炸性增长，计算效率成为制约数据挖掘应用的关键因素。优化数据挖掘中的计算效率不仅关乎任务完成的速度，还直接影响到资源的合理利用和成本效益。本文将从算...

生成式AI 2025-06-21 大数据

655阅读

数据挖掘中的gpu加速技术

标题：数据挖掘中的GPU加速技术：提升效率与洞察力的关键随着大数据时代的到来，数据挖掘作为从海量数据中提取有价值信息和模式的关键技术，其重要性日益凸显。然而，面对动辄数以亿计的数据集，传统的CPU处理模式往往显得力不从心，处理速度慢、能耗高成为制约数据挖掘...

大数据 2025-06-21 大数据

711阅读

数据挖掘中的高维数据挑战

数据挖掘，作为现代信息技术的重要组成部分，旨在从庞大的数据集中提取有价值的信息和知识。然而，随着数据收集技术的飞速发展，我们所面临的数据集往往呈现出高维度特性，即数据集中的特征（或属性）数量非常多。高维数据在为数据分析提供更多可能性的同时，也带来了一系列独...

AIGC 2025-06-20 大数据

711阅读

数据清洗工具性能优化：提升处理效率

数据清洗是数据分析与机器学习流程中不可或缺的一环，它直接关系到后续模型训练的效果与准确性。随着大数据时代的到来，数据量呈指数级增长，如何高效地进行数据清洗成为了亟待解决的问题。数据清洗工具的性能优化，特别是提升处理效率，成为了数据科学家和工程师们关注的焦点...

生成式AI 2025-06-09 大数据

809阅读

数据清洗工具性能优化建议更新：提升处理效率

标题：数据清洗工具性能优化策略：提升处理效率的关键更新在大数据时代，数据清洗是数据分析与机器学习项目中不可或缺的一环。高效、准确的数据清洗能够显著提升后续数据处理的效率与质量。然而，随着数据量的爆炸性增长，传统数据清洗工具在处理大规模数据集时常面临性能瓶颈...

AIGC 2025-06-07 大数据

636阅读

大模型应用开发，AI 厂商开启新一轮“群雄逐鹿”？

价格战的硝烟似乎还没有平息，但 AI 厂商们的又一场战争已经开始。这一次的竞争核心是大模型应用开发。根据 IDC 报告，2023年中国大模型平台及相关应用市场规模约还仅有区区17.65亿元人民币，但伴随着行业的巨变，2024年，模型应用开发相关的产业规模...

大数据 2024-10-29 人工智能

2450阅读

开源模型应用落地-qwen2.5-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100（十八）

一、前言本篇文章将使用LLaMA-Factory去高效微调（命令和界面方式）QWen2.5系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。 QWen2系列模型微调: 开源模型应用落...

AIGC 2024-10-12 人工智能

3935阅读

大模型存储选型 & JuiceFS 在关键环节性能详解

从去年开始，LLM大语言模型领域发展迅速、如 LLaMA、ChatGLM、Baichuan、Qwen 和 yi-model 等基础模型（Foundation Models）的数量显著增加。众多企业也开始基于这些基础模型做 post-training 的相关...

生成式AI 2024-10-12 人工智能

1610阅读

如何在Android上运行Llama 3.2

引言随着Llama 3.2的发布，Meta在将强大的语言模型带到边缘和移动设备方面取得了重大进展。Llama 3.2包含了专为智能手机和平板电脑高效运行而设计的轻量级模型（1B和3B参数）。本教程将指导您通过MLC LLM库对Llama 3.2模型进...

AIGC 2024-10-05 人工智能

1929阅读

Meta发布Llama 3.2，Llama 终于能看见了！

Llama家族再添新成员，多模态能力终于到来！ Meta刚刚发布了Llama 3.2模型系列，包括多模态视觉模型和小型文本模型，共计10个开放权重模型。这次更新不仅带来了期待已久的视觉能力，还为移动设备和边缘计算提供了更多选择。多模态Llam...

生成式AI 2024-10-04 人工智能

1882阅读

LLM | llama.cpp 安装使用（支持CPU、Metal及CUDA的单卡/多卡推理）

1. 详细步骤 1.1 安装 cuda 等 nvidia 依赖（非CUDA环境运行可跳过） # 以 CUDA Toolkit 12.4: Ubuntu-22.04/24.04(x86_64 为例，注意区分 WSL 和 Ubuntu，详见 http...

大数据 2024-10-04 人工智能

3849阅读

使用 CTranslate2 实现 Faster Whisper 的加速转录

使用 CTranslate2 实现 Faster Whisper 的加速转录近年来，语音识别技术得到了快速发展。OpenAI 的 Whisper 模型作为其中的佼佼者，以其高精度和强大的性能广受欢迎。然而，其较长的推理时间和高内存消耗也成为了限制其应...

生成式AI 2024-10-04 人工智能

2692阅读

推荐文章：深度探索图像生成新境界 - TensorRT Extension for Stable Diffusion

推荐文章：深度探索图像生成新境界 - TensorRT Extension for Stable Diffusion Stable-Diffusion-WebUI-TensorRTTensorRT Extension for Stable Diffus...

人工智能 2024-10-04 人工智能

1617阅读

llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程

llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程 llama3.cudallama3.cuda is a pure C/CUDA implementation for Llama 3 model.项目地址:https://git...

AIGC 2024-10-03 人工智能

1338阅读

AI PC（智能电脑）技术分析

一文看懂AI PC（智能电脑）     2024年，英特尔、英伟达等芯片巨头革新CPU技术，融入AI算力，为传统PC带来质的飞跃，引领智能计算新时代。 2024年，因此被叫作人工智能电脑（AI PC）的“元...

大数据 2024-10-03 人工智能

1231阅读

探索无限创意：基于C++的Stable Diffusion图像生成库

探索无限创意：基于C++的Stable Diffusion图像生成库 axodox-machinelearning This repository contains a C++ ONNX implementation of StableDiffus...

AIGC 2024-10-03 人工智能

1419阅读

Whisper JAX：闪电般快速的语音识别框架

Whisper JAX：闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gi...

大数据 2024-10-03 人工智能

1659阅读

【AIGC】ComfyUI安装及常见问题cuda及pytorch安装教程

说明：ComfyUI安装方式有很两种，第一种是下载独立包。独立包下载到本地后，即可使用。不需要搭建（安装）python、cuda、cudnn、pytorch环境. 第二种是，手动安装。手动安装要复杂很多，需要搭建开发环境，即安装python、cuda、c...

生成式AI 2024-10-03 人工智能

3022阅读

Chinese-Vicuna: 一个基于LLaMA的中文指令跟随模型

Chinese-Vicuna简介 Chinese-Vicuna是一个基于LLaMA的中文指令跟随模型，由研究者开发，旨在以低资源的方式实现高效的中文语言模型训练。该项目的主要目标是构建和分享可以在单个Nvidia RTX-2080TI上训练的中文指令跟随...

生成式AI 2024-10-02 人工智能

1232阅读

深度技术分析：Meta Llama 3模型训练故障剖析

## 摘要 Meta公司在一项涉及16,384个Nvidia H100 80GB GPU的Llama 3 405B模型训练中，遭遇了频繁的硬件故障。在54天的训练期间，平均每三小时就发生一次组件故障，其中半数故障与GPU或其HBM3内存有关。尽管面临如此挑...

AIGC 2024-10-02 人工智能

1422阅读

本地搭建 Whisper 语音识别模型

Whisper 是由 OpenAI 开发的一款强大的语音识别模型，具有出色的多语言处理能力。搭建和使用 Whisper 模型可以帮助您将音频内容转换为文本，这在语音转写、语音助手、字幕生成等应用中都具有广泛的用途。本指南将对如何在本地环境中搭建 Whisp...

AIGC 2024-10-02 人工智能

2081阅读

Unsloth 教程 - 如何微调 Llama-3并导出到 Ollama

本文翻译整理自：? How to Finetune Llama-3 and Export to Ollamahttps://docs.unsloth.ai/tutorials/how-to-finetune-llama-3-and-export-to-ol...

大数据 2024-10-02 人工智能

3542阅读

Stable Diffusion & ComfyUI（一）

前言我是 Porterxie，一位对技术充满好奇的程序员。最近，我对 Stable Diffusion（下文中统称为 SD）以及 ComfyUI 进行了初步的学习和研究，想在这里分享下学习过程中的一些经验及理解。在此之前，人工智能对我来讲，完全是一...

AIGC 2024-10-02 人工智能

1459阅读

llama factory LoRA微调qwen大模型 | 新手炼丹记录(1)

往期回顾 llama factory LoRA微调qwen大模型 | 新手炼丹记录(1 -CSDN博客大模型使用llama.cpp转换gguf格式并量化 | 新手炼丹记录(2 -CSDN博客 oll...

生成式AI 2024-10-02 人工智能

2075阅读

LLaMa-Factory入门教程

LLaMa-Factory是一个基于人工智能技术的开源项目，专为大型语言模型（LLMs）的微调而设计。它提供了丰富的工具和接口，使得用户能够轻松地对预训练的模型进行定制化的训练和调整，以适应特定的应用场景。以下将详细介绍如何使用LLaMa-Factory：...

生成式AI 2024-10-02 人工智能

1692阅读

【丹摩智算实战】手把手教你Llama 3.1 8B部署：开启自然语言处理新篇章

前言在自然语言处理（NLP）领域，大模型（LLM）的发展日新月异，为各种应用场景带来了前所未有的能力。近日，Meta公司宣布推出了其最新的开源模型——Llama 3.1，这一消息在行业内引起了广泛关注。本文将详细介绍Llama 3.1的背景、特点、部...

生成式AI 2024-10-01 人工智能

1596阅读

LLaMA- Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

发表时间：14 Jun 2023 论文链接：https://arxiv.org/pdf/2303.16199 作者单位：Shanghai Artificial Intelligence Laboratory Motivation：最近，指令跟踪模型取...

大数据 2024-10-01 人工智能

1581阅读

Ubuntu LLaMA-Factory实战

一、Ubuntu LLaMA-Factory实战安装： CUDA 安装 CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型，它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。首先，在 https://develop...

生成式AI 2024-10-01 人工智能

1618阅读

保姆级 Stable Diffusion 教程，看完这篇就够了！

在美国科罗拉多州举办了一场新兴数字艺术家竞赛，一幅名为《太空歌剧院》的作品获得“数字艺术/数字修饰照片”类别的一等奖，神奇的是，该作品的作者并没有绘画基础，这幅画是他用 AI 生成的。这让人们充分见识到AI 在绘画领域惊人的创造力，AI 作品不仅可...

AIGC 2024-10-01 人工智能

1535阅读

马斯克万亿追击OpenAI，钢铁侠大战奥特曼

钢铁侠大战奥特曼，已经在大洋彼岸的美国上演了，而且比电影里精彩多了，这是一场靠燃烧美元持续的朴实无华的商战。这个奥特曼就是OpenAI的CEO山姆奥特曼了，钢铁侠就是埃隆马斯克了。在9月11日这个对美国来说有特殊意义的日子，彭博社发消息说OpenAI又...

生成式AI 2024-10-01 人工智能

1430阅读

Windows安装docker，启动ollama运行open-webui使用AIGC大模型写周杰伦歌词

Windows安装docker，启动ollama运行open-webui使用AIGC大模型写周杰伦歌词 1、下载docker的Windows版本。 docker下载地址： https://docs.docker.com/desktop/insta...

生成式AI 2024-10-01 人工智能

2134阅读

【AI绘画教程】ComfyUI基础篇：小白都可以学会的ComfyUI安装教程（原生版安装包）

大家好，我是程序员晓晓自从Flux这一款最新黑马文生图模型推出以来，Flux的浪潮正以不可阻挡之势席卷全球，目前本地电脑环境要玩Flux, 支持方式主要是ComfyUI。但是ComfyUI工具安装一直是很多小白比较困惑的地方，在和小伙伴的私下留言中，C...

人工智能 2024-10-01 人工智能

4259阅读

探索LLaMA模型的无限可能：LLaMA API服务器项目推荐

探索LLaMA模型的无限可能：LLaMA API服务器项目推荐 llama-api An OpenAI-like LLaMA inference API 项目地址: https://gitcode.com/gh_mirrors/ll/llama...

大数据 2024-10-01 人工智能

1614阅读

Insanely Fast Whisper CLI 项目教程

Insanely Fast Whisper CLI 项目教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...

AIGC 2024-10-01 人工智能

1470阅读

使用Ollama本地部署Llama 3.1大模型

Llama 3.1 介绍 2024 年 7 月 24 日，Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B，Llama 3.1 405B 支持上下文长度为 128K Tokens，增加了对八种语言的支持，号称第一个在常识、可...

人工智能 2024-10-01 人工智能

2560阅读

Meta Llama 3介绍及其关键技术

随着深度学习算法的突破和发展，语言模型已经成为连接人与机器的重要桥梁。在这一领域中，Meta的Llama 3 作为最新一代的大规模预训练模型，凭借其卓越的性能和广泛的应用前景，正逐渐成为行业内的佼佼者。 Llama 3 的研发团队继承了前代模型的技术优势...

AIGC 2024-09-30 人工智能

1779阅读

使用 GaLore 预训练LLaMA-7B

项目代码： https://github.com/jiaweizzhao/galorehttps://github.com/jiaweizzhao/galore 参考博客： https://zhuanlan.zhihu.com/p/686686751...

生成式AI 2024-09-30 人工智能

1379阅读

3天把Llama训成Mamba，性能不降，推理更快！

近日，Mamba方面又搞出了有意思的研究：来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。\ 先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（...

生成式AI 2024-09-30 人工智能

1448阅读

AIGC时代！AI的“iPhone时刻”与投资机遇

AIGC时代！AI的“iPhone时刻”与投资机遇前言 AI的“iPhone时刻”与投资机遇前言 AIGC，也就是人工智能生成内容，它就像是一股汹涌的浪潮，席卷了整个科技世界。它的出现，让我们看到了人工智能的无限潜力，也让我们...

AIGC 2024-09-30 人工智能

1186阅读

Whisper ASR Webservice 使用教程

Whisper ASR Webservice 使用教程 whisper-asr-webserviceOpenAI Whisper ASR Webservice API项目地址:https://gitcode.com/gh_mirrors/wh/whis...

AIGC 2024-09-30 人工智能

1859阅读

AIGC大模型扩图：Sanster/IOPaint（4）

AIGC大模型扩图：Sanster/IOPaint（4）用大模型实现AI扩大一张图的周边区域，变得更大，当然必须契合原图，和原图浑然一体。 1、这次模型换用 Sanster/PowerPaint-V1-stable-diffusion-inp...

大数据 2024-09-29 人工智能

1348阅读