-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
LLaVA:GPT-4V(ision) 的开源替代品
LLaVA(大型语言和视觉助理)(链接::https://llava-vl.github.io/)是一个很有前途的开源生成式人工智能模型,它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中,允许讨论这些图像...
-
AIGC实战——归一化流模型(Normalizing Flow Model)
AIGC实战——归一化流模型 0. 前言 1. 归一化流模型 1.1 归一化流模型基本原理 1.2 变量变换 1.3 雅可比行列式 1.4 变量变换方程 2. RealNVP 2.1 Two Moons 数据集 2.2 耦合层 2.3 通...
-
openai-whisper
openai-whisper 0. 参数说明 1. 视频语音转文字 demo 1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕 1. 下载b站视频到电脑 2. 提取视频中的音频 3. 音频转文字 4. 自己的视频去掉音频,增...
-
【部署LLaMa到自己的Linux服务器】
部署LLaMa到自己的Linux服务器 一、官方方法(知道就好,具体操作用不上这个) 1、Llama2 项目获取 方法1:有git可以直接克隆到本地 方法2:直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...
-
详解“小而优”的大语言模型Zephyr 7B
Zephyr是Hugging Face发布的一系列大语言模型,使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练,显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码,以应对ChatGPT...
-
Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw
本文首发于公众号:机器感知 Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw SHViT: Single-Head Vision Transformer with Memory Ef...
-
从Hugging Face下载数据测试whisper、fast_whisper耗时
时长比较短的音频:https://huggingface.co/datasets/PolyAI/minds14/viewer/en-US 时长比较长的音频:https://huggingface.co/datasets/librispeech_asr?r...
-
LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比
12.10更新:Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理:数据频率和质量,使用聚类和去重方法,基于LSH和dense embedding方...
-
gpt和llama的推理prompt
gpt completion = openai.ChatCompletion.create( # model="gpt-3.5-turbo", model='gpt-4', messages=[ { "role": "system", "content...
-
.Net接入AzureOpenAI、OpenAI、通义千问、智谱AI、讯飞星火、文心一言大语言模型。
前言 现在在网上搜索.NET接入大模型的帖子很少,有些官方案例只提供java和python的SDK,所以有了这篇.Net的接入大模型文章,目前仅实现对话模型的调用。 这里仅举例通义千问,其他模型实现可以参考Gi他Hub 对您有帮助的话帮忙点个star...
-
引言:ChatGPT与AIGC技术的发展与应用
1.背景介绍 1. 背景介绍 自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge(ILSVRC ,深度学习技术开始引以为奉。随着算法的不断发展和优化,深度...
-
基于医疗领域数据微调LLaMA——ChatDoctor模型
文章目录 ChatDoctor简介 数据构建和训练过程 建立外部知识库 ChatDoctor相比ChatGPT有什么优势? ChatDoctor的效果 代码解读 train_lora.py文件解读 微调实战 下载仓库并进入目录 创建con...
-
AI 绘画平台难开发,难变现?试试 Stable Diffusion API Serverless 版解决方案
作者:王佳、江昱、筱姜 Stable Diffusion 模型,已经成为 AI 行业从传统深度学习时代走向 AIGC 时代的标志性里程碑。越来越多的开发者借助 stable-diffusion-webui(以下简称 SDWebUI)能力进行 AI 绘画领...
-
【扩散模型】万字长文全面理解与应用Stable Diffusion
万字长文全面理解与应用Stable Diffusion 1. Stable Diffusion简介 1.1 基本概念 1.2 主体结构 1.3 训练细节 1.4 模型评测 1.5 模型应用 1.6 模型版本 1.7 其他类型的条件生成模型 1...
-
仅做笔记用:Stable Diffusion 获取历史生成图片的 prompt
不知怎么搞的,图库浏览器点开图片看不到生成图片的信息了。但是据信这些信息是写在 PNG 数据的某个附加区段的(参考博客文章《Python - PNG图掺入隐藏文本信息》)。Stable Diffusion 原生支持读取这些信息。并且除了图库浏览器,还有一个...
-
2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架
摘要: 2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架 LangChain指南-打造LLM的垂域AI框架 CHATGPT以来,Langchain 可能是目前在 AI 领域中最热门的事物之一,仅次于向量数据库。...
-
Stable Diffusion XL Turbo 文生图和图生图实践
本篇文章聊聊,如何快速上手 Stable Diffusion XL Turbo 模型的文生图和图生图实战。 写在前面 分享一篇去年 11 月测试过模型,为月末分享的文章做一些技术铺垫,以及使用新的环境进行完整复现。 本篇文章相关的代码保存在 sou...
-
大模型技术实践(三)|用LangChain和Llama 2打造心灵疗愈机器人
上期文章我们实现了Llama 2-chat-7B模型的云端部署和推理,本期文章我们将用“LangChain+Llama 2”的架构打造一个定制化的心灵疗愈机器人。有相关知识背景的读者可以直接阅读「实战」部分。 01 背景...
-
利用colab实现AI绘画自由
利用colab实现AI绘画自由 最近AIGC真的很火,除了chatGPT外,AI绘画也是热度不减。最近也是决定抽空上手尝试一下,但奈何我的本本太渣,丐版Mac跑跑数据还行,跑Stable Diffusion根本没戏。所以还是决定白嫖谷歌的colab。...
-
Whisper——部署fast-whisper中文语音识别模型
whisper:https://github.com/openai/whisper/tree/main 参考文章:Whisper OpenAI开源语音识别模型 环境配置 pip install faster-whisper transformer...
-
GitHub Copilot使用方法
大家好,我是升仔 引言 GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它通过理解代码的上下文,自动提供代码补全建议,大大提高编程效率。接下来,我将介绍如何使用GitHub Copilot,并提供一...
-
Android 拍照以及相册中选择(适配高版本)————上传头像并裁剪(一)
前言 在项目研发中,相信大家都遇到过给用户增加头像照片的需求。 随着手机版本的不断更新,android 8、android 9、android 10、android 12、android 13、鸿蒙系统等等;遇到这个功能需...
-
深入浅出完整解析Stable Diffusion(SD)核心基础知识
2022年,Stable Diffusion模型横空出世,其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一,并为工业界,投资界,学术界以及竞赛界都注入了新的AI想象空间,让AI再次性感。 Stable Diffusion是计算机视觉领域的...
-
Chinese-LLaMA-Alpaca本地搭建(三)
Chinese-LLaMA-Alpaca模型搭建(三) 1、简单介绍 1.1 原版LLaMA模型介绍 1.2 LoRA权重模型 1.3 完整版权重模型 2、模型搭建 2.1 直接到huggingface下载转换后的LLaMA hf模型 2...
-
Essential AI与Google Cloud达成全新多年合作伙伴关系,加速全栈生成式AI产品发展
Essential AI与Google Cloud宣布建立全新的多年合作伙伴关系,旨在简化和扩展全栈生成人工智能产品的开发,助力企业用户做出数据驱动的决策。该合作使Essential AI成为首批充分利用Google Cloud全新TPU v5p的公司之一...
-
Essential AI选择谷歌云作为其人工智能的支持
Essential AI选择了谷歌云。Essential AI是一家由两位著名的前谷歌员工创立的企业初创公司,它选择了谷歌云作为其人工智能服务的支撑。 图源备注:图片由AI生成,图片授权服务商Midjourney 谷歌、微软和亚马逊都在试图说服初创公司在...
-
【AI】Chinese-LLaMA-Alpaca-2 7B llama.cpp 量化方法选择及推理速度测试 x86_64 RTX 2060 6G 显存太小了
环境 操作系统 CPU 内存 生成量化版本模型 转换出q4_0 q4_k q6_k q8_0模型 cd ~/Downloads/ai/llama.cpp sourvce venv/bin/activate ~/Downloads/...
-
第三十二章:ChatGPT与AIGC在物联网领域的应用
1.背景介绍 物联网(Internet of Things,IoT 是指通过互联网将物体和设备连接起来,实现数据的传输和共享。物联网技术已经广泛应用于各个领域,如智能家居、智能城市、智能制造、智能农业等。随着数据量的增加和计算能力的提高,人工智能...
-
【AIGC】从零手写一个GPT
手写一个GPT 在GPT,确切的说是Transformer,出现之前,一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。 比如我们有两句话 我喜欢你 吾中意你 它们作为句子内容并不一样,但是表达的含义却...
-
谷歌与Singular Computing达成AI专利纠纷和解
谷歌刚刚和一家人工智能技术专利诉讼的对手达成了数十亿美元的和解。这家硬件和软件开发公司Singular Computing从谷歌那里获得了一笔未公开的和解金,这结束了Singular的创始人Joseph Bates博士对谷歌提起的长达五年的联邦法院专利侵权...
-
谷歌与Hugging Face携手,共推开源模型助力AI发展
Google与Hugging Face近日宣布战略合作,旨在推动开放AI和机器学习的发展。这一合作将集成Hugging Face的平台与Google Cloud的基础设施,包括Vertex AI,旨在使生成式AI更易于开发者使用。这一合作的重要性被认为是A...
-
360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
输入一张任意姿势的照片,想让照片里的人跟随「指定视频」来进行动作模仿并不简单,除了肢体动作的模仿外,模型还需要对运动过程中衣服、人物外观的变化进行建模。 如果输入图像是正面的,而模仿的视频动作包括转身的话,模型还需要「想象」出衣服的背面样子,以及衣...
-
谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍
谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPU v5p人工智能芯片比以往任何时候都更快、更大、更宽,甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时,也发布了其最新版本的旗舰张量处理单元(TPU),用于人工...
-
谷歌云与Hugging Face签署人工智能基础设施合作协议
谷歌公司(Google LLC)云计算部门今天宣布与Hugging Face公司建立新的合作伙伴关系,后者是一个流行的共享开源人工智能模型平台运营商。 根据协议,谷歌云将成为Hugging Face人工智能训练和推理工作负载的 “首选目的地”。此外,两...
-
LLaMA Efficient Tuning
文章目录 LLaMA Efficient Tuning 安装 数据准备 浏览器一体化界面 单 GPU 训练 train_bash 1、预训练 pt 2、指令监督微调 sft 3、奖励模型训练 rm 4、PPO 训练 ppo 5、DPO 训练...
-
webassembly003 whisper.cpp的项目结构CMakeLists.txt
注:带星号的为非重要部分 基础配置 cmake_minimum_required (VERSION 3.5 project(whisper.cpp VERSION 1.5.0 # Add path to modules list(APPEND...
-
利用 “diart“ 和 OpenAI 的 Whisper 简化实时转录
利用 "diart" 和 OpenAI 的 Whisper 简化实时转录 工作原理 Diart 是一个基于人工智能的 Python 库,用于实时记录说话者语言(即 "谁在什么时候说话"),它建立在 pyannote.audio 模型之上,专为实时音频流...
-
stable diffusion代码学习笔记
前言:本文没有太多公式推理,只有一些简单的公式,以及公式和代码的对应关系。本文仅做个人学习笔记,如有理解错误的地方,请指出。 本文包含stable diffusion入门文献和不同版本的代码。 文献资源 本文学习的代码; 相关文献: D...
-
一文教会你使用AI绘画利器Stable Diffusion!这可能是CSDN最全的AI绘画使用教程,建议收藏!
大家好,我是程序员晓晓 随着 stable-diffusion 的开源,让更多人有机会直接参与到 AI 绘画的创作中,相关的教程也如雨后春笋般的出现。可是目前我看到的教程同质性较高,通常只能称作为"使用流程讲解",但是通常没有对其原理和逻辑进行深入说明。...
-
哪些编程语言和领域最适合应用AIGC技术?
1. 引言 人工智能技术的发展已经深刻影响了各个行业,使得自动化和智能化成为了当今的一个热点。与此同时,应用在人工智能领域的算法和模型也变得越来越复杂。为了更好地应对这些挑战,越来越多的开发者开始关注应用于智能计算的编程语言和领域。本文将深入讨论哪些编...
-
Stable Diffusion 硬核生存指南:WebUI 中的 CodeFormer
本篇文章聊聊 Stable Diffusion WebUI 中的核心组件,强壮的人脸图像面部画面修复模型 CodeFormer 相关的事情。 写在前面 在 Stable Diffusion WebUI 项目中,源码 modules 目录中,有一个有趣...
-
使用 Transformers 为多语种语音识别任务微调 Whisper 模型
本文提供了一个使用 Hugging Face 🤗 Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,并提供...
-
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...
-
甲骨文变身“AI狂战士”,MySQL、Java、OCI,一切技术栈火力全开,猛战AI!
撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 太猛了!甲骨文已经按捺不住,就像找了某种魔法钥匙一般,准备在2024年大干一场! 近日,甲骨文宣布正在将生成式AI功能集成到该公司的整个云服务OCI(Oracle Cloud In...
-
FTC调查微软、OpenAI等五大AI公司大规模生成式AI交易
联邦贸易委员会(FTC)在生成 AI 领域进行了首次重要的竞争行为调查,对五家顶级生成 AI 技术开发者展开了调查。 该机构今天向亚马逊、微软、OpenAI、Anthropic 和 Alphabet 发出了6(b) 令,要求这些公司提供有关最近数十亿美元的...
-
使用人工智能助手 Github Copilot 进行编程 01
本章涵盖了 AI 助⼿如何改变新程序员的学习⽅式 为什么编程永远不会再⼀样了 AI 助⼿如 Copilot 的⼯作原理 Copilot 如何解决⼊⻔级编程问题 AI 辅助编程的潜在危险 在本章中,我们将讨论人类如何与计算机进行交流。我们将向...
-
一文读懂Stable Diffusion 论文原理+代码超详细解读
背景 Stable diffusion是一个基于Latent Diffusion Models(LDMs)实现的的文图生成(text-to-image)模型。 2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院(Théâtre...
-
AIGC:文生图模型Stable Diffusion
1 Stable Diffusion介绍 Stable Diffusion 是由CompVis、Stability AI和LAION共同开发的一个文本转图像模型,它通过LAION-5B子集大量的 512x512 图文模型进行训练,我们只要简单的输入一段文...
-
OpenAI创始人想打造全球芯片工厂网络 设计制造一把抓以对抗英伟达
OpenAI联合创始人Sam Altman最近提出一个设想,他想在全球打造AI芯片工厂网络,以对抗英伟达。 为了训练大语言模型,AI企业需要采购大量英伟达GPU,耗资不菲。当模型正常运营,向消费者开放,运营费用更是天文数字。 如何降低成本?大企业绞尽脑...