pytorch 第9页 - AIGC资讯

AIGC 实战：如何使用 Ollama 开发自定义的大模型（LLM）

虽然 Ollama 提供了运行和交互式使用大型语言模型（LLM）的功能，但从头开始创建完全定制化的 LLM 需要 Ollama 之外的其他工具和专业知识。然而，Ollama 可以通过微调在定制过程中发挥作用。以下是细分说明：预训练模型选择： Oll...

AIGC 2024-03-06 人工智能

2359阅读

三足鼎立的开源大模型：Llama、Gemma和Mistral

关于Llama 3的最新消息，Meta计划在今年7月推出这一全新的开源大模型。Llama 3的最大版本预计将拥有超过1400亿个参数，这意味着它的性能将远超过前一代的Llama 2。至于Llama 3是否将具备多模态能力，目前尚未有确切的信息。同时，谷...

AIGC 2024-03-05 人工智能

1432阅读

【MacOS】openai 语音识别模型 whisper 本地部署教程（cpu+mps方案）

目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程安装homebrew 安装Python （不要超过3.10）安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项可...

人工智能 2024-03-04 人工智能

3037阅读

Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路

Meta AI 研究团队推出的 MobileLLM 标志着大语言模型（LLMs）朝着模拟人类理解和生成自然语言迈出了革命性的一步。LLMs 在处理和分析大量数据集方面的能力已经显著影响了自动化客户服务、语言翻译和内容创作等多个领域。然而，由于传统 LLMs...

人工智能 2024-03-04 人工智能

1063阅读

一些安装AUTOMATIC1111的Stable Diffusion WebUI常遇到的错误消息的解决方式

确保电脑符合Stable Diffusion的系统需求 1. 电脑硬件需求最低配备建议配备注解显卡(GPU GTX1050Ti RTX3060Ti 支持的显卡芯片有Nvidia/AMD/Intel Arc/Apple M。显...

大数据 2024-03-02 人工智能

1380阅读

Hugging Face AI 平台中发现100个恶意代码执行模型

研究人员发现，大约有100个机器学习模型被上传到 Hugging Face 人工智能（AI）平台，可能使攻击者能够在用户机器上注入恶意代码。这一发现进一步强调了当攻击者操纵公开可用的 AI 模型用于恶意活动时所带来的不断增长的威胁。 JFrog 安全研究...

生成式AI 2024-03-01 人工智能

932阅读

基本概念：什么是ChatGPT和AIGC

1.背景介绍 1. 背景介绍自2012年的AlphaGo胜利以来，人工智能(AI 技术的进步速度逐年加快，尤其是自然语言处理(NLP 领域的突破性进展。ChatGPT和AIGC是近年来引起广泛关注的两个AI技术。本文将深入探讨这两个技术的核...

AIGC 2024-03-01 人工智能

842阅读

Github Copilot 程序员效率提升工具

AI时代到来，Github Copilot问世以下是GitHub的首席执行官 Thomas 在2022年6月21日，首次将Github Copilot面向个人开发者全面开放的公告。什么是 Github Copilot 简单来说就是能帮助程...

AIGC 2024-02-29 人工智能

1074阅读

自动驾驶与轨迹预测看这一篇就够了！

本文经自动驾驶之心公众号授权转载，转载请联系出处。轨迹预测在自动驾驶中承担着重要的角色，自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据，预测车辆未来的行驶轨迹。作为自动驾驶的核心模块，轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈...

生成式AI 2024-02-27 人工智能

887阅读

高性能 LLM 推理框架的设计与实现

一、大语言模型推理概要介绍与传统的 CNN 模型推理不同，大语言模型的推理通常会分成 prefill 和 decoding 两个阶段。每一个请求发起后产生的推理过程都会先经历一个 Prefill 过程，prefill 过程会计算用户所有的输入，并生...

AIGC 2024-02-26 人工智能

1151阅读

huggingface学习|用dreambooth和lora对stable diffusion模型进行微调

目录用dreambooth对stable-diffusion-v1-5模型进行微调（一）模型下载和环境配置（二）数据集准备（三）模型微调（四）运行微调后的模型用lora对stable-diffusion-v1-5模型进行微调...

生成式AI 2024-02-26 人工智能

1309阅读

技术精英求职必备：AIGC(图像生成)研发工程师简历指南

核心原则撰写针对AIGC(图像生成研发工程师职位的简历时，关键在于准确展现您在深度学习、计算机视觉和图像生成算法方面的综合技能、项目经验和技术成就。简历应作为您展示跨多个技术栈的编程能力、构建完整的图像生成解决方案和有效解决AIGC技术问题的能力的窗...

大数据 2024-02-26 人工智能

1273阅读

AIGC项目——Meta:根据对话音频生成带动作和手势的3d逼真数字人

From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations From Audio to Photoreal Embodiment:Synthesizing Humans...

人工智能 2024-02-24 人工智能

956阅读

AI语音识别模块--whisper模块

1.下载 ffmpeg，挑一个自己电脑系统的版本，下载，如我win64：地址： Releases · BtbN/FFmpeg-Builds · GitHub 下载压缩包zip，到·本地解压安装，其实无需安装，只需把对应的目录下的bin，...

人工智能 2024-02-24 人工智能

1496阅读

CUDA驱动深度学习发展 - 技术全解与实战

全面介绍CUDA与pytorch cuda实战关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师，项目管理专业人士，上亿营收...

AIGC 2024-02-24 人工智能

934阅读

WhisperFusion：具有超低延迟无缝对话功能的AI系统

WhisperFusion 基于 WhisperLive 和 WhisperSpeech 的功能而构建，在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM 。 LLM 和 Whisper 都经过优化，可作为 TensorRT 引擎高效运...

人工智能 2024-02-23 人工智能

904阅读

Google Gemma开放模型官网体验入口谷歌AI开源语言免费下载地址

Gemma是Google推出的一系列开源的轻量级语言模型系列。它结合了全面的安全措施，在尺寸上实现了优异的性能，甚至超过了一些较大的开放模型。可以无缝兼容各种框架。提供快速入门指南、基准测试、模型获取等，帮助开发者负责任地开发AI应用。点击前往Gemm...

大数据 2024-02-22 人工智能

1294阅读

使用AIGC技术提高AI系统效率

1.背景介绍在AI领域，提高系统效率是一个重要的目标。一种有效的方法是使用人工智能生成(AIGC 技术。在本文中，我们将探讨AIGC技术的背景、核心概念、算法原理、最佳实践、应用场景、工具和资源推荐，以及未来发展趋势和挑战。 1. 背景介绍...

AIGC 2024-02-21 人工智能

928阅读

AIGC：腾讯云服务器快速部署stable-diffusion环境，使用ChilloutMix模型进行画图

文章目录 @[toc] 背景一. **购买服务器** 二. **前置配置** 三. **部署webui，完成配置** 四. **其他探索** 其他背景前两天在某公众号的软文刷到了AI绘画领域最新的ChilloutM...

AIGC 2024-02-21 人工智能

964阅读

网络安全人士必知的AI框架

一、AI框架的重要性 AI框架是人工智能的操作系统，是基础软件，是算法和应用的根基。AI江湖传言：得框架者得天下，可见AI框架的重要性，它通过框架性思维整合了人工智能的三驾马车(算法、算力、数据，如果想成为头部AI企业，AI框架就是其中一项核心竞争力...

AIGC 2024-02-21 人工智能

911阅读

英伟达NeMo框架在AI领域的综合应用与优势总结

一、NeMo 框架介绍 NVIDIA NeMo 是基于 PyTorch 和 PyTorch Lightning 的一个开源训练框架，源代码完全公开在 GitHub 上。NeMo 的主要目标是使 AI 开发者能够快速构建对话式 AI 模型并开发相关应用。...

人工智能 2024-02-21 人工智能

1002阅读

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraf...

AIGC 2024-02-21 人工智能

1154阅读

为什么人工智能应该开源？

在当今快速发展的数字时代，人工智能几乎处于所有行业革命性创新的前沿。从医疗保健、教育到娱乐，人工智能的变革性影响是显而易见的。什么是开源人工智能? 开源人工智能是人工智能软件和工具，其源代码开放并向公众开放。开发人员、研究人员和其他感兴趣的各方可以访...

生成式AI 2024-02-20 人工智能

796阅读

【AIGC】Stable Diffusion的常见错误

Stable Diffusion 在使用过程中可能会遇到各种各样的错误。以下是一些常见的错误以及可能的解决方案：模型加载错误：可能出现模型文件损坏或缺失的情况。解决方案包括重新下载模型文件，确保文件完整并放置在正确的位置。依赖项错误：Stable...

人工智能 2024-02-20 人工智能

1245阅读

自然语言生成任务中的五种采样方法介绍和Pytorch代码实现

在自然语言生成任务(NLG 中，采样方法是指从生成模型中获取文本输出的一种技术。本文将介绍常用的5中方法并用Pytorch进行实现。 1、Greedy Decoding Greedy Decoding在每个时间步选择当前条件概率最高的词语作为输出，直到...

大数据 2024-02-19 人工智能

918阅读

20240202在WIN10下使用fast whisper缺少cudnn_ops_infer64_8.dll

20240202在WIN10下使用fast whisper缺少cudnn_ops_infer64_8.dll 2024/2/2 10:48 https://blog.csdn.net/feinifi/article/details/132548556...

人工智能 2024-02-17 人工智能

1348阅读

一图揽尽全球LLM崛起之路；LLM概念速查清单；DALL·E提示词红宝书·在线版；fast.ai新课带你从零实现Stable Diffusion | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? LLM 崛起之路：全球大语言模型「规模增长」可视化交互图 https://informationisbeautiful.net/visual...

人工智能 2024-02-17 人工智能

1241阅读

图像生成与修复：AI绘画的新时代

1.背景介绍图像生成与修复是一种非常重要的计算机视觉任务，它可以帮助我们创建新的图像，并修复损坏或不完整的图像。随着人工智能技术的发展，图像生成与修复的能力也在不断提高，使得AI绘画成为了一个热门的研究领域。在本文中，我们将讨论图像生成与...

大数据 2024-02-16 人工智能

1024阅读

LLMs之Llama2 70B：使用 PyTorch FSDP 微调 Llama 2 70B实现全部过程讲解之详细攻略

LLMs之Llama2 70B：使用 PyTorch FSDP 微调 Llama 2 70B实现全部过程讲解之详细攻略目录使用 PyTorch FSDP 微调 Llama 2 70B 引言 FSDP 工作流使用的硬件微调 LLa...

生成式AI 2024-02-16 人工智能

1872阅读

Stable Diffusion AI绘画系列【16】:霸气侧漏的二次元武侠风

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

AIGC 2024-02-15 人工智能

939阅读

使用deepspeed继续训练LLAMA

目录 1. 数据训练配置 2. 模型载入 3. 优化器设置 4. DeepSpeed 设置 5. DeepSpeed 初始化 6. 模型训练 LLAMA 模型子结构： 1. 数据训练配置利用 PyTorch 和 Transfo...

生成式AI 2024-02-15 人工智能

1145阅读

Docker部署Stable-Diffusion-webui

前排提示：如果不想折腾，可直接跳到最后获取封装好的容器，一键运行 :D 前言乘上AI生成的快车，一同看看沿途的风景。启一个miniconda容器 docker run -itd -v 宿主机内SD项目路径:/tmp --gpus all --...

人工智能 2024-02-15 人工智能

1472阅读

扩散模型的发展过程梳理多个扩散模型理论知识总结/DDPM去噪扩散概率/IDDPM/DDIM隐式去噪/ADM/SMLD分数扩散/CGD条件扩散/Stable Diffusion稳定扩散/LM

前言 1.最近发现自己光探索SDWebUI功能搞了快两个月，但是没有理论基础后面科研路有点难走，所以在师兄的建议下，开始看b站视频学习一下扩散模型，好的一看一个不吱声，一周过去了写个博客总结一下吧，理理思路。不保证下面的内容完全正确，只能说是一个菜鸟的思...

AIGC 2024-02-15 人工智能

2146阅读

Stable Diffusion绘画系列【8】:美食海报设计

《博主简介》小伙伴们好，我是阿旭。专注于人工智能AI、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐------》...

人工智能 2024-02-13 人工智能

963阅读

AIGC工具

1. 图转文 BLIP：输入图片，生成对图片的描述，用于制作训练模型的数据集工具 GitHub - salesforce/BLIP: PyTorch code for BLIP: Bootstrapping Language-Image Pre-tr...

人工智能 2024-02-13 人工智能

903阅读

win部署stable-diffusion

win部署stable-diffusion 1.环境 2.模型 3.使用 4.效果 1.环境首先下载stable-diffusion-webui，这个包了一层ui，特别好用。 git clone https://github....

生成式AI 2024-02-12 人工智能

907阅读

Whisper 从0安装教程 windows

这里写自定义目录标题 Whisper 从0安装教程 windows 安装过程安装python3.11 安装Anaconda 在Anaconda里面安装whisper 安装 ffmpeg 第一次运行whisper 检查GPU 一些弯路...

AIGC 2024-02-11 人工智能

1529阅读

利用python+whisper生成视频字幕文件

文章目录前言 1.本地环境 2.安装所需要的库 3.导入相关库 4.获取指定路径下的所有视频文件 5.导入模型进行音频识别 6.将识别结果转换为srt字幕文件 7.完成代码前言最近在看一些网课，由于没有字幕看着非常费劲，需要...

大数据 2024-02-10 人工智能

1125阅读

Stable diffusion使用和操作流程

Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型，可以生成包括人脸在内的任何图像，因...

人工智能 2024-02-10 人工智能

964阅读

m2安装stable-diffusion报错及解决方案

背景：自己的电脑是macbookpro m2,之前装很多软件都遇到各种问题，不出意外，装这个stable-diffusion一样遇到各种问题，现在总结一下安装过程中遇到的问题。报错一： Launching Web UI with argument...

人工智能 2024-02-10 人工智能

1678阅读

【AIGC】Diffusers:加载管道、模型和调度程序

前言拥有一种使用扩散系统进行推理的简单方法对于?扩散器至关重要。扩散系统通常由多个组件组成，例如参数化模型、分词器和调度器，它们以复杂的方式进行交互。这就是为什么我们设计了 DiffusionPipeline，将整个扩散系统的复杂性包装成一个易于使用的...

人工智能 2024-02-10 人工智能

1661阅读

详解各种LLM系列｜LLaMA 1 模型架构、预训练、部署优化特点总结

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』，加入 NewBee讨论组 LLaMA 是Meta在2...

生成式AI 2024-02-10 人工智能

1918阅读

20240131在WIN10下配置whisper

20240131在WIN10下配置whisper 2024/1/31 18:25 首先你要有一张NVIDIA的显卡，比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡！】800￥ 2、请正确安装好NVIDIA最新的545版本的驱动程序...

大数据 2024-02-10 人工智能

920阅读

如何使用AIGC进行图像生成和编辑

1.背景介绍图像生成和编辑是计算机视觉领域的重要应用，随着人工智能技术的发展，AIGC(Artificial Intelligence Generative Convolutional 已经成为了图像生成和编辑的主流方法。在本文中，我们将详细介...

大数据 2024-02-10 人工智能

1998阅读

如何在Linux上安装Stable Diffusion WebUI

Stable Diffusion WebUI是一个基于AUTOMATIC1111的stable-diffusion-webui仓库的项目，允许用户通过web界面轻松地生成AI驱动的图像。本文将指导您在Linux系统上完成Stable Diffusion W...

人工智能 2024-02-09 人工智能

1269阅读

实战whisper：本地化部署通用语音识别模型

前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。这里呢，我将给出我的一些代码，来帮助你尽快实现【语音转文字】的服务部署...

生成式AI 2024-02-09 人工智能

2625阅读

AIGC：人工智能生成技术的新兴领域

1.背景介绍 1. 背景介绍人工智能生成技术(AIGC 是一种利用机器学习和自然语言处理等技术来自动生成自然语言文本或其他形式的内容的技术。这种技术在近年来取得了显著的进展，为各种应用场景提供了强大的支持。本文将从背景、核心概念、算法原理、...

AIGC 2024-02-09 人工智能

1449阅读

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战，但实际上，Whisper的使用者完全可以针对中文的语音做一些优化的措施，换句话说，Whisper的“默认”形态可能在中文领域斗不过FunAsr，但是经过中文特殊优化的Whisper就未必...

AIGC 2024-02-09 人工智能

919阅读

2023年的深度学习入门指南(19) - LLaMA 2源码解析

2023年的深度学习入门指南(19 - LLaMA 2源码解析上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。补全函数text_completion源码解析上一节我们讲了LLaMA 2的...

大数据 2024-02-09 人工智能

1098阅读

【candle】（2）：使用hf-mirror镜像下载TheBloke/Llama-2-7B-GGML的q4_0.bin文件，并设置HF_HOME，example模块可以识别下载的模型

1，视频演示地址 https://www.bilibili.com/video/BV1Dc41117wT/?vd_source=4b290247452adda4e56d84b659b0c8a2 【candle】（2）：使用hf-mir...

生成式AI 2024-02-08 人工智能

1391阅读