tpu 第15页 - AIGC资讯

【深度学习】SDXL tensorRT 推理，Stable Diffusion 转onnx，转TensorRT

文章目录 1 sdxl 转 diffusers 2 转onnx 3 转TensorRT 1 sdxl 转 diffusers juggernautXL_version6Rundiffusion.safetensors文件...

大数据 2024-02-06 人工智能

1270阅读

aigc修复美颜学习笔记

目录 GFPGAN进行图像人脸修复美颜修复畸形手势 GFPGAN进行图像人脸修复原文：本地使用GFPGAN进行图像人脸修复_人相修复处理网页 csdn-CSDN博客人脸修复 1.下载项目和权重文件 2.部署环境 3.下载权重文件...

人工智能 2024-02-06 人工智能

1006阅读

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

生成式AI 2024-02-06 人工智能

924阅读

AIGC在物联网与智能制造中的实践

1.背景介绍 1. 背景介绍物联网和智能制造是当今最热门的技术领域之一，它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展，人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...

AIGC 2024-02-06 人工智能

1134阅读

20240131在ubuntu20.04.6下使用whisper不同模式的比对

20240131在ubuntu20.04.6下使用whisper不同模式的比对 2024/1/31 16:07 首先你要有一张NVIDIA的显卡，比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡！】 2、请正确安装好NVIDIA最新...

生成式AI 2024-02-06 人工智能

863阅读

从0开始用 PyTorch 构建完整的 NeRF

本文经自动驾驶之心公众号授权转载，转载请联系出处。在解释代码之前，首先对NeRF（神经辐射场）的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的： “我们提出了一个当前最优的方法，应用于复杂场景下合成新视图的任务，具体的实现原理是...

生成式AI 2024-02-06 人工智能

963阅读

LLaVA：GPT-4V(ision) 的开源替代品

LLaVA（大型语言和视觉助理）（链接：：https://llava-vl.github.io/）是一个很有前途的开源生成式人工智能模型，它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中，允许讨论这些图像...

生成式AI 2024-02-06 人工智能

978阅读

AIGC实战——归一化流模型(Normalizing Flow Model)

AIGC实战——归一化流模型 0. 前言 1. 归一化流模型 1.1 归一化流模型基本原理 1.2 变量变换 1.3 雅可比行列式 1.4 变量变换方程 2. RealNVP 2.1 Two Moons 数据集 2.2 耦合层 2.3 通...

人工智能 2024-02-06 人工智能

1784阅读

openai-whisper

openai-whisper 0. 参数说明 1. 视频语音转文字 demo 1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕 1. 下载b站视频到电脑 2. 提取视频中的音频 3. 音频转文字 4. 自己的视频去掉音频,增...

大数据 2024-02-05 人工智能

744阅读

【部署LLaMa到自己的Linux服务器】

部署LLaMa到自己的Linux服务器一、官方方法（知道就好，具体操作用不上这个） 1、Llama2 项目获取方法1：有git可以直接克隆到本地方法2：直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...

生成式AI 2024-02-04 人工智能

1416阅读

详解“小而优”的大语言模型Zephyr 7B

Zephyr是Hugging Face发布的一系列大语言模型，使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练，显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码，以应对ChatGPT...

人工智能 2024-02-04 人工智能

827阅读

Single-Head ViT；Faster Whisper；Transformer KF；Pick-and-Draw

本文首发于公众号：机器感知 Single-Head ViT；Faster Whisper；Transformer KF；Pick-and-Draw SHViT: Single-Head Vision Transformer with Memory Ef...

人工智能 2024-02-04 人工智能

767阅读

从Hugging Face下载数据测试whisper、fast_whisper耗时

时长比较短的音频：https://huggingface.co/datasets/PolyAI/minds14/viewer/en-US 时长比较长的音频：https://huggingface.co/datasets/librispeech_asr?r...

AIGC 2024-02-04 人工智能

863阅读

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和dense embedding方...

大数据 2024-02-03 人工智能

1875阅读

gpt和llama的推理prompt

gpt completion = openai.ChatCompletion.create( # model="gpt-3.5-turbo", model='gpt-4', messages=[ { "role": "system", "content...

AIGC 2024-02-03 人工智能

751阅读

.Net接入AzureOpenAI、OpenAI、通义千问、智谱AI、讯飞星火、文心一言大语言模型。

前言现在在网上搜索.NET接入大模型的帖子很少，有些官方案例只提供java和python的SDK，所以有了这篇.Net的接入大模型文章，目前仅实现对话模型的调用。这里仅举例通义千问，其他模型实现可以参考Gi他Hub 对您有帮助的话帮忙点个star...

生成式AI 2024-02-03 人工智能

931阅读

引言:ChatGPT与AIGC技术的发展与应用

1.背景介绍 1. 背景介绍自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge(ILSVRC ，深度学习技术开始引以为奉。随着算法的不断发展和优化，深度...

人工智能 2024-02-03 人工智能

915阅读

基于医疗领域数据微调LLaMA——ChatDoctor模型

文章目录 ChatDoctor简介数据构建和训练过程建立外部知识库 ChatDoctor相比ChatGPT有什么优势？ ChatDoctor的效果代码解读 train_lora.py文件解读微调实战下载仓库并进入目录创建con...

人工智能 2024-02-03 人工智能

1039阅读

AI 绘画平台难开发，难变现？试试 Stable Diffusion API Serverless 版解决方案

作者：王佳、江昱、筱姜 Stable Diffusion 模型，已经成为 AI 行业从传统深度学习时代走向 AIGC 时代的标志性里程碑。越来越多的开发者借助 stable-diffusion-webui（以下简称 SDWebUI）能力进行 AI 绘画领...

生成式AI 2024-02-02 人工智能

780阅读

【扩散模型】万字长文全面理解与应用Stable Diffusion

万字长文全面理解与应用Stable Diffusion 1. Stable Diffusion简介 1.1 基本概念 1.2 主体结构 1.3 训练细节 1.4 模型评测 1.5 模型应用 1.6 模型版本 1.7 其他类型的条件生成模型 1...

AIGC 2024-02-02 人工智能

3806阅读

仅做笔记用：Stable Diffusion 获取历史生成图片的 prompt

不知怎么搞的，图库浏览器点开图片看不到生成图片的信息了。但是据信这些信息是写在 PNG 数据的某个附加区段的（参考博客文章《Python - PNG图掺入隐藏文本信息》）。Stable Diffusion 原生支持读取这些信息。并且除了图库浏览器，还有一个...

生成式AI 2024-02-02 人工智能

774阅读

2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架

摘要: 2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架 LangChain指南-打造LLM的垂域AI框架 CHATGPT以来，Langchain 可能是目前在 AI 领域中最热门的事物之一，仅次于向量数据库。...

大数据 2024-02-02 人工智能

1399阅读

Stable Diffusion XL Turbo 文生图和图生图实践

本篇文章聊聊，如何快速上手 Stable Diffusion XL Turbo 模型的文生图和图生图实战。写在前面分享一篇去年 11 月测试过模型，为月末分享的文章做一些技术铺垫，以及使用新的环境进行完整复现。本篇文章相关的代码保存在 sou...

大数据 2024-02-02 人工智能

999阅读

大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人

上期文章我们实现了Llama 2-chat-7B模型的云端部署和推理，本期文章我们将用“LangChain+Llama 2”的架构打造一个定制化的心灵疗愈机器人。有相关知识背景的读者可以直接阅读「实战」部分。 01 背景...

AIGC 2024-02-01 人工智能

1410阅读

利用colab实现AI绘画自由

利用colab实现AI绘画自由最近AIGC真的很火，除了chatGPT外，AI绘画也是热度不减。最近也是决定抽空上手尝试一下，但奈何我的本本太渣，丐版Mac跑跑数据还行，跑Stable Diffusion根本没戏。所以还是决定白嫖谷歌的colab。...

大数据 2024-02-01 人工智能

1051阅读

Whisper——部署fast-whisper中文语音识别模型

whisper：https://github.com/openai/whisper/tree/main 参考文章：Whisper OpenAI开源语音识别模型环境配置 pip install faster-whisper transformer...

生成式AI 2024-02-01 人工智能

1399阅读

GitHub Copilot使用方法

大家好，我是升仔引言 GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它通过理解代码的上下文，自动提供代码补全建议，大大提高编程效率。接下来，我将介绍如何使用GitHub Copilot，并提供一...

AIGC 2024-02-01 人工智能

1365阅读

Android 拍照以及相册中选择(适配高版本)————上传头像并裁剪(一)

前言在项目研发中，相信大家都遇到过给用户增加头像照片的需求。随着手机版本的不断更新，android 8、android 9、android 10、android 12、android 13、鸿蒙系统等等；遇到这个功能需...

生成式AI 2024-02-01 人工智能

1305阅读

深入浅出完整解析Stable Diffusion（SD）核心基础知识

2022年，Stable Diffusion模型横空出世，其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一，并为工业界，投资界，学术界以及竞赛界都注入了新的AI想象空间，让AI再次性感。 Stable Diffusion是计算机视觉领域的...

人工智能 2024-01-31 人工智能

2783阅读

Chinese-LLaMA-Alpaca本地搭建（三）

Chinese-LLaMA-Alpaca模型搭建（三） 1、简单介绍 1.1 原版LLaMA模型介绍 1.2 LoRA权重模型 1.3 完整版权重模型 2、模型搭建 2.1 直接到huggingface下载转换后的LLaMA hf模型 2...

生成式AI 2024-01-30 人工智能

747阅读

Essential AI与Google Cloud达成全新多年合作伙伴关系，加速全栈生成式AI产品发展

Essential AI与Google Cloud宣布建立全新的多年合作伙伴关系，旨在简化和扩展全栈生成人工智能产品的开发，助力企业用户做出数据驱动的决策。该合作使Essential AI成为首批充分利用Google Cloud全新TPU v5p的公司之一...

AIGC 2024-01-30 人工智能

807阅读

Essential AI选择谷歌云作为其人工智能的支持

Essential AI选择了谷歌云。Essential AI是一家由两位著名的前谷歌员工创立的企业初创公司，它选择了谷歌云作为其人工智能服务的支撑。图源备注：图片由AI生成，图片授权服务商Midjourney 谷歌、微软和亚马逊都在试图说服初创公司在...

AIGC 2024-01-30 人工智能

752阅读

【AI】Chinese-LLaMA-Alpaca-2 7B llama.cpp 量化方法选择及推理速度测试 x86_64 RTX 2060 6G 显存太小了

环境操作系统 CPU 内存生成量化版本模型转换出q4_0 q4_k q6_k q8_0模型 cd ~/Downloads/ai/llama.cpp sourvce venv/bin/activate ~/Downloads/...

AIGC 2024-01-30 人工智能

1015阅读

第三十二章：ChatGPT与AIGC在物联网领域的应用

1.背景介绍物联网(Internet of Things，IoT 是指通过互联网将物体和设备连接起来，实现数据的传输和共享。物联网技术已经广泛应用于各个领域，如智能家居、智能城市、智能制造、智能农业等。随着数据量的增加和计算能力的提高，人工智能...

人工智能 2024-01-29 人工智能

845阅读

【AIGC】从零手写一个GPT

手写一个GPT 在GPT，确切的说是Transformer，出现之前，一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。比如我们有两句话我喜欢你吾中意你它们作为句子内容并不一样，但是表达的含义却...

人工智能 2024-01-29 人工智能

930阅读

谷歌与Singular Computing达成AI专利纠纷和解

谷歌刚刚和一家人工智能技术专利诉讼的对手达成了数十亿美元的和解。这家硬件和软件开发公司Singular Computing从谷歌那里获得了一笔未公开的和解金，这结束了Singular的创始人Joseph Bates博士对谷歌提起的长达五年的联邦法院专利侵权...

生成式AI 2024-01-29 人工智能

727阅读

谷歌与Hugging Face携手，共推开源模型助力AI发展

Google与Hugging Face近日宣布战略合作，旨在推动开放AI和机器学习的发展。这一合作将集成Hugging Face的平台与Google Cloud的基础设施，包括Vertex AI，旨在使生成式AI更易于开发者使用。这一合作的重要性被认为是A...

AIGC 2024-01-29 人工智能

719阅读

360度无死角！UC伯克利华人发布3DHM框架：一张图片即可模仿任意视频动作

输入一张任意姿势的照片，想让照片里的人跟随「指定视频」来进行动作模仿并不简单，除了肢体动作的模仿外，模型还需要对运动过程中衣服、人物外观的变化进行建模。如果输入图像是正面的，而模仿的视频动作包括转身的话，模型还需要「想象」出衣服的背面样子，以及衣...

生成式AI 2024-01-29 人工智能

821阅读

谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍

谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPU v5p人工智能芯片比以往任何时候都更快、更大、更宽，甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时，也发布了其最新版本的旗舰张量处理单元（TPU），用于人工...

生成式AI 2024-01-29 人工智能

796阅读

谷歌云与Hugging Face签署人工智能基础设施合作协议

谷歌公司（Google LLC）云计算部门今天宣布与Hugging Face公司建立新的合作伙伴关系，后者是一个流行的共享开源人工智能模型平台运营商。根据协议，谷歌云将成为Hugging Face人工智能训练和推理工作负载的 “首选目的地”。此外，两...

AIGC 2024-01-29 人工智能

809阅读

LLaMA Efficient Tuning

文章目录 LLaMA Efficient Tuning 安装数据准备浏览器一体化界面单 GPU 训练 train_bash 1、预训练 pt 2、指令监督微调 sft 3、奖励模型训练 rm 4、PPO 训练 ppo 5、DPO 训练...

AIGC 2024-01-29 人工智能

843阅读

webassembly003 whisper.cpp的项目结构CMakeLists.txt

注：带星号的为非重要部分基础配置 cmake_minimum_required (VERSION 3.5 project(whisper.cpp VERSION 1.5.0 # Add path to modules list(APPEND...

AIGC 2024-01-28 人工智能

1006阅读

利用 “diart“ 和 OpenAI 的 Whisper 简化实时转录

利用 "diart" 和 OpenAI 的 Whisper 简化实时转录工作原理 Diart 是一个基于人工智能的 Python 库，用于实时记录说话者语言（即 "谁在什么时候说话"），它建立在 pyannote.audio 模型之上，专为实时音频流...

人工智能 2024-01-28 人工智能

951阅读

stable diffusion代码学习笔记

前言：本文没有太多公式推理，只有一些简单的公式，以及公式和代码的对应关系。本文仅做个人学习笔记，如有理解错误的地方，请指出。本文包含stable diffusion入门文献和不同版本的代码。文献资源本文学习的代码；相关文献： D...

大数据 2024-01-28 人工智能

922阅读

一文教会你使用AI绘画利器Stable Diffusion！这可能是CSDN最全的AI绘画使用教程，建议收藏！

大家好，我是程序员晓晓随着 stable-diffusion 的开源，让更多人有机会直接参与到 AI 绘画的创作中，相关的教程也如雨后春笋般的出现。可是目前我看到的教程同质性较高，通常只能称作为"使用流程讲解"，但是通常没有对其原理和逻辑进行深入说明。...

AIGC 2024-01-28 人工智能

1841阅读

哪些编程语言和领域最适合应用AIGC技术？

1. 引言人工智能技术的发展已经深刻影响了各个行业，使得自动化和智能化成为了当今的一个热点。与此同时，应用在人工智能领域的算法和模型也变得越来越复杂。为了更好地应对这些挑战，越来越多的开发者开始关注应用于智能计算的编程语言和领域。本文将深入讨论哪些编...

AIGC 2024-01-28 人工智能

1040阅读

Stable Diffusion 硬核生存指南：WebUI 中的 CodeFormer

本篇文章聊聊 Stable Diffusion WebUI 中的核心组件，强壮的人脸图像面部画面修复模型 CodeFormer 相关的事情。写在前面在 Stable Diffusion WebUI 项目中，源码 modules 目录中，有一个有趣...

人工智能 2024-01-27 人工智能

986阅读

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时，我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识，并提供...

大数据 2024-01-27 人工智能

1119阅读

使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速

Open AI 推出的 Whisper 是一个通用语音转录模型，在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜，被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...

人工智能 2024-01-27 人工智能

857阅读

甲骨文变身“AI狂战士”，MySQL、Java、OCI，一切技术栈火力全开，猛战AI！

撰稿 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）太猛了！甲骨文已经按捺不住，就像找了某种魔法钥匙一般，准备在2024年大干一场！近日，甲骨文宣布正在将生成式AI功能集成到该公司的整个云服务OCI（Oracle Cloud In...

大数据 2024-01-26 人工智能

784阅读