-
AIGC笔记总结(二):扩散模型原理
?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数...
-
ocr识别原理和场景应用浅析
Labs 导读 日常生活的截图提取、拍照搜题,都用到了文字识别领域占据重要地位的OCR(光学字符识别)技术。 Part 01、 什么是OCR OCR(光学字符识别)是计算机文字识别的一种方法,利用光学技术和计算机技术将印刷或手写在纸张等介质的文...
-
Python+AI实现AI绘画
? 运行环境:Python ? 撰写作者:左手の明天 ? 精选专栏:《python》 ? 推荐专栏:《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???,我是左手の明天!好久不见? ?今天分享py...
-
【前沿技术】文心一言 PK Chat Gpt
目录 写在前面 一、文心一言 二、Chat GPT 三、对比 四、总结 写在前面 随着人工智能技术的不断发展和普及,越来越多的智能应用走入了人们的日常生活,如智能语音助手、智能客服、机器翻译等等。在这些应用...
-
【Python】本地版 Whisper 自动转录器(附源码网址)
目 录 一、实时自动语音转录器简介 二、开源Whisper实时转录器 三、pyinstaller 打包发布exe应用程序 四、修改版源代码 ...
-
Stable Diffusion教程(4) - 模型种类介绍
stable diffusion是一种文本生成图片的大模型。它可以使用不同种类的模型生成图片,每种模型都有特定的功能,从而实现对不同细节的定制化处理。 1. CheckPoint模型 首先是CheckPoint模型,它是stable diffusi...
-
PillarNeSt:如何进一步提升基于Pillar的3D目标检测性能?
写在前面 && 笔者的个人理解 目前在自动驾驶领域中,一辆自驾汽车会配备多种传感器,如:激光雷达传感器采集点云数据、相机传感器采集图像数据等。由于激光雷达传感器可以更加准确的获取待检测物体的几何和位置信息,所以基于点云的感知算法模型在快速...
-
AI绘画 | stable-diffusion的模型简介和下载使用
前言 我们下载完stable-diffusion-ui后还需要下载需要的大模型,才能进行AI绘画的操作。秋叶的stable-diffusion-ui整合包内,包含了anything-v5-PrtRE.safetensors和Stable Diffusi...
-
最强文生图跨模态大模型:Stable Diffusion
文章目录 一、概述 二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练 三、Stable Diffusion 发展 3.1 图形界面...
-
LLaMA模型之中文词表的蜕变
在目前的开源模型中,LLaMA模型无疑是一颗闪亮的⭐️,但是相对于ChatGLM、BaiChuan等国产大模型,其对于中文的支持能力不是很理想。原版LLaMA模型的词表大小是32K,中文所占token是几百个左右,这将会导致中文的编解码效率低。 在将LL...
-
重磅!苹果官方发布大模型框架:一个可以充分利用苹果统一内存的新的大模型框架MLX,你的MacBook可以一键运行LLaMA了
本文来自DataLearnerAI官方网站:重磅!苹果官方发布大模型框架:一个可以充分利用苹果统一内存的新的大模型框架MLX,你的MacBook可以一键运行LLaMA了 | 数据学习者官方网站(Datalearner https://www.datalea...
-
【腾讯云 HAI域探秘】使用Stable Diffusion大模型生成惊世骇俗的图片!
文章目录 前言 环境准备 高性能应用服务 HAI资格申请 购买HAI高性能服务 生成图片 界面汉化: 输入提示词生成图片 参数列表: 根据提示词生成图片 总结: 优点: 缺点: 前言 AI绘画工具的发展历史可以追溯...
-
python训练ai作画的代码
你可以使用 Python 来训练一个 AI 来进行绘画。这里是一个基本的代码示例: ``` import tensorflow as tf 定义输入和输出的占位符 inputs = tf.placeholder(shape=...
-
Hugging News #0814: Llama 2 学习资源大汇总
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...
-
神经网络是如何工作的? | 京东云技术团队
作为一名程序员,我们习惯于去了解所使用工具、中间件的底层原理,本文则旨在帮助大家了解AI模型的底层机制,让大家在学习或应用各种大模型时更加得心应手,更加适合没有AI基础的小伙伴们。 一、GPT与神经网络的关系 GPT想必大家已经耳熟能详,当我们与它...
-
ChatGPT与Google Bard那个更好?
AIGC 行业最大的两个竞争对手:ChatGPT vs Google Bard! 本文介绍这两个人工智能引擎之间的技术差异。 截至目前Google Bard和ChatGPT之间最大的区别是:Bard知道ChatGPT,但ChatGPT却对Bard懵然不知。...
-
你真的看懂扩散模型(diffusion model)了吗?(从DALL·E 2讲起,GAN、VAE、MAE都有)
本文全网原创于CSDN:落难Coder ,未经允许,不得转载! 扩散模型简单介绍 我们来讲一下什么是扩散模型,如果你不了解一些工作,你可能不清楚它究竟是什么。那么我举两个例子说一下:AI作画(输入一些文字就可以得到与你描述相符的图像)和抖音大火的...
-
【原创】AIGC之ChatGPT工作原理
AIGC是什么 AIGC - AI Generated Content (AI生成内容),对应我们的过去的主要是 UGC(User Generated Content)和 PGC(Professional user Generated Content...
-
各家LLM大模型写作能力大比拼【GPT4、ChatGPT、ChatGLM-6B、ChatGLM-130B、文心一言、讯飞星火、Claude+】《人工智能之神经网络的前世今生和未来发展趋势》为标题
禅与计算机程序设计艺术评测结论: GPT4 > ChatGLM-130B > ChatGPT > 讯飞星火 > 文心一言 ~ ChatGLM-6B > Claude+ 文章目录 Prompt: 你...
-
【扩散模型】2、DDPM | 去噪扩散概率模型开山之作
文章目录 数学基础知识 一、背景 二、DDPM 主要过程 2.1 前向扩散过程 2.2 逆向去噪过程 2.3 训练和推理 论文:Denoising Diffusion Probabilistic Models 代码:http...
-
深度学习实战28-AIGC项目:自动生成定制化的PPT文件
大家好,我是微学AI,今天给大家介绍一下深度学习实战28-AIGC项目:自动生成定制化的PPT文件,AIGC项目是一个基于自然语言处理技术的创新性项目,旨在利用ChatGPT模型生成定制化的PPT文件。该项目主要应用于商务和教育领域,可以帮助用户快速创建具...
-
自动驾驶大模型论文调研与简述
最近关于大模型(LLMs, VLM 与自动驾驶相关文献调研与汇总: 适合用于什么任务?答:目前基本上场景理解、轨迹预测、行为决策、运动规划、端到端控制都有在做。 大家都怎么做的? 对于规控任务,LLM型基本是调用+Prompt设计,集中在输入和输出设计...
-
【stable diffusion 小白最全详细使用教程+大模型资源】
文章目录 一、前言 二、安装 1.解压后点击启动器运行依赖,然后点击A启动器 2.更新本体和扩展 3.把controlnet1.1放入stable diffusion 中 三、使用界面参数 1.提示词 2.采样和迭代步数 3.修...
-
ChatGPT:开启AI新纪元-人工智能AI
报告地址:ChatGPT:开启AI新纪元-人工智能AI 随着人工智能技术的不断发展,越来越多的领域开始应用人工智能技术来提高效率和质量。其中,自然语言处理技术的应用尤为广泛,人们使用自然语言处理技术来进行语音识别、机器翻译、文本分类等。而在这些...
-
机器学习 - 混淆矩阵:技术与实战全方位解析
本文深入探讨了机器学习中的混淆矩阵概念,包括其数学原理、Python实现,以及在实际应用中的重要性。我们通过一个肺癌诊断的实例来演示如何使用混淆矩阵进行模型评估,并提出了多个独特的技术洞见。文章旨在为读者提供全面而深入的理解,从基础到高级应用。...
-
文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研
基于近年来图像处理和语言理解方面的技术突破,融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。 文本生成图像(text-to-image)是图像和文本处理的多模态任务的一项子任务,其根据给定文本生成符合描述的真实图像,具有巨大的应用潜力,如...
-
aigc是什么
一、AIGC的基本概念 AI生成内容(AIGC),是指运用人工智能技术,尤其是深度学习技术,创建各类数字内容的新型内容创作模式。AIGC继承了专业生成内容(PGC)的高质量特点,再结合用户生成内容(UGC)的分布式、互动的特点,打造了全新的数字内容生成与...
-
LCM:大大加快生成高质量图像的新方法
作者丨Mike Young 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 图片 得益于一种名为潜在一致性模型(LCM)的新技术,文本转换成图像的AI即将迎来重大飞跃。潜在扩散模型(LDM)等传统方法在使用...
-
AIGC零基础30天学习——CLIP模型
1. 模型架构 Contrastive Language-Image Pre-training(以下简称“CLIP”)是OpenAI 在 2021 年初发布的用于匹配图像和文本的预训练神经网络模型,可以说是近年来在多模态研究领域的...
-
景联文科技:一文读懂火爆全网的AIGC和背后的数据标注技术!
“在过去的几个月中,AIGC发展速度惊人,DALL-E、Midjourney和Stable Diffusion等技术的快速发展,创作出了许多由AI生成的艺术品。本文中,我们将为您阐述AIGC技术和背后所涉及的数据标注技术。" 今年八月,美国的一位39...
-
AI生成内容(AIGC):概念、实现与未来趋势
一、AIGC的基本概念 AI生成内容(AIGC),是指运用人工智能技术,尤其是深度学习技术,创建各类数字内容的新型内容创作模式。AIGC继承了专业生成内容(PGC)的高质量特点,再结合用户生成内容(UGC)的分布式、互动的特点,打造了全新的数字内容生成与...
-
浅谈人工智能中的算力、算法和数据
Labs 导读 随着科技的飞速发展,人工智能(Artificial Intelligence,AI)已经成为当今最热门的话题之一。在人工智能的应用中,算力、算法和数据是三个不可或缺的要素,也是生成式人工智能(AIGC)发展的核心。通过对人工智能中算...
-
今日思考(2) — 训练机器学习模型用GPU还是NUP更有优势(基于文心一言的回答)
前言 深度学习用GPU,强化学习用NPU。 1.训练深度学习模型,强化学习模型用NPU还是GPU更有优势 在训练深度学习模型时,GPU相比NPU有优势。GPU拥有更高的访存速度和更高的浮点运算能力,因此更适合深度学...
-
Stable Diffusion 系列教程 | 打破模型壁垒
目录 1.模型基本分类 1.1 CheckPoint 大模型/底模型/主模型 1.2 VAE美化模型/变分自编码器 1.3 HyperNetwork 超网络 1.4 embeddings(/Textual Inversion) 嵌入式向量 1....
-
边缘智能:实现实时数据处理和智能决策的新一代技术
Labs 导读 边缘智能(Edge Intelligence)是一种将人工智能(AI)和边缘计算相结合的新兴技术。传统的人工智能应用通常依赖于云计算中心进行数据处理和决策,但这种方式存在延迟和网络带宽的问题。 Part 01、 什么是边缘智能 ...
-
教你如何使用PyTorch解决多分类问题
本文分享自华为云社区《使用PyTorch解决多分类问题:构建、训练和评估深度学习模型》,作者: 小馒头学Python。 引言 当处理多分类问题时,PyTorch是一种非常有用的深度学习框架。在这篇博客中,我们将讨论如何使用PyTorch来解决多分类...
-
ChatGPT 使用到的机器学习技术
作者 | Bright Liao 在《程序员眼中的 ChatGPT》一文中,我们聊到了开发人员对于ChatGPT的认知。本文来聊一聊ChatGPT用到的机器学习技术。 机器学习技术的发展 要聊ChatGPT用到的机器学习技术,我们不得不回顾一下机器学...
-
Stability AI推出视频生成模型Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Di...
-
自动驾驶中基于深度学习的预测和规划融合方法综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A...
-
Stable Diffusion8
也写到第八了 ~~ 这次还是和mac相关哦~~ 先吹吹,苹果亲自下场优化,在iPhone、iPad、Mac等设备上以惊人的速度运行Stable Diffusion就是这么简单。 输入一句话就能生成图像的 Stable Diffusion 已经火爆数月...
-
stable diffusion(Lora的训练)
以坤坤为例,上网随便找了几个坤坤的人脸图像,作为训练的数据集 1 训练环境搭建 建议看一遍教程,虽然这个up主好像不是很专业的样子,不过流程差不多是这样的,重点关注一下虚拟环境搭建完之后,在终端选择配置的操作,就是一堆yes no,的选项,跟着视...
-
【AIGC】深入理解 LORA模型
深入理解 LORA模型 LORA模型是一种神经网络模型,它通过学习可以自动调整神经网络中各层之间的权重,以提高模型的性能。本文将深入探讨LORA模型的原理、应用场景、优缺点等方面。 1. LORA模型的原理 LORA模型的全称为Learnable...
-
〔003〕Stable Diffusion 之 界面参数和基础使用 篇
✨ 目录 ▷ 界面参数 ▷ 采样器 ▷ 文生图(txt2img) ▷ 图生图(img2img) ▷ 标签权重 ▷ 模型下载 ▷ 界面参数 在使用 Stable Diffusion 开源 AI 绘画之前,需要了解一下绘画...
-
关于AI 绘画,我给你总结了一份详细的关键词(Prompt 知识)
写在前面 随着人工智能技术的不断发展,越来越多的应用场景被发掘。其中,AI绘画是一种新兴的领域,其应用范围涵盖了数字媒体、游戏设计、动画制作、艺术创作等多个领域。在本文中,我们将介绍AI绘画的基本概念、发展历程、技术原理以及应用前景。 基本概念...
-
详解超强ResNet变体NFNet:抛弃归一化后,性能却达到了最强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从上古时期一直到今天,Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络,并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...
-
AI图像生成模型LCMs: 四个步骤就能快速生成高质量图像的新方法
在最新的AI模型和研究领域,一种名为Latent Consistency Models(LCMs)的新技术正迅速推动文本到图像人工智能的发展。与传统的Latent Diffusion Models(LDMs 相比,LCMs在生成详细且富有创意的图像方面同样...
-
能跟「猫主子」聊天了!生成式AI带来的全面革命:最快五年内破译第一种动物语言
所罗门能够与动物交流并不是因为他拥有魔法物品,而是因为他有观察的天赋。 ——康拉德・劳伦兹《所罗门王的指环》 在《狮子王》、《疯狂动物城》等以动物为中心的作品中,作者...
-
AI绘画Stable Diffusion安装、使用教程 整合包下载
安装Stable Diffusion webui 效果图: 1.准备工作 在下载 AI 绘画工具前,电脑上需要提前下载一些运行的环境 1.下载python、git 首先本地机器最好是英伟达的 N 卡,并且至少需要 4GB 显存才能在本地...
-
昇腾CANN DVPP硬件加速训练数据预处理,友好解决Host CPU预处理瓶
本文分享自华为云社区《昇腾CANN 7.0 黑科技:DVPP硬件加速训练数据预处理,友好解决Host CPU预处理瓶颈》,作者: 昇腾CANN 。 随着人工智能的快速发展,越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成...
-
【云上探索实验室】CodeWhisperer——AI辅助编程不是梦
目录 一、AI辅助编程 二、安装与配置 三、使用教程 四、体验心得 一、AI辅助编程 随着机器学习和深度学习的兴起,人工智能已经迎来了爆发式的发展。机器学习使得计算机能够通过数据学习和改进性能,而深度学习则基于神经...