编码器-解码器 - AIGC资讯

【AIGC从零开始】AIGC小白学习心得第二讲：3D生成模型

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Stable Video 3D（sv3d）二、TripoSR 三、LRM系列 1.LRM 2.GS-LRM 3.OpenLRM 四、CRM 五...

大数据 2024-09-08 人工智能

1374阅读

一文看懂llama2 (原理&模型&训练)

LLaMA2是一种基于Transformer架构的先进语言模型，广泛应用于自然语言处理（NLP）任务，如文本生成、机器翻译和问答系统等。本文将从其核心原理、模型结构以及训练方法三个方面进行详细探讨。一、核心原理 LLaMA2的核心原理是基于自注意力机...

人工智能 2024-08-27 人工智能

1136阅读

stable diffusion--小白学习步骤

1.看一下Unet网络的讲解_哔哩哔哩_bilibili，了解Unet网络 2.看一下【生成式AI】Diffusion Model 原理剖析 (1/4 _哔哩哔哩_bilibili，起码要看前3/6个视频 3.看一下超详细的扩散模型（Diffusion...

大数据 2024-08-21 人工智能

850阅读

微调（一）

微调有两种办法，一是模型全部参数的微调，二是少量参数高效的微调。前者由于参数多，需要的GPU多，并且全参数微调可能把模型带偏，后者只需要微调少量参数，需要的GPU少，还可能达到不错的效果，成为大家研究的重点，取了个专有名词Parameter-Effic...

AIGC 2024-08-20 人工智能

1218阅读

【人工智能AIGC技术开发】3.浅谈大话人工智能AIGC：几种AIGC底层技术的代码详解

为了更好地理解AIGC（AI Generated Content，人工智能生成内容）的底层技术，我们将详细介绍几种关键技术。这些技术包括深度学习、生成对抗网络（GANs）、变分自编码器（VAEs）和自回归模型（如Transformer和GPT）。 1....

人工智能 2024-08-09 人工智能

1066阅读

一文看懂LLaMA 2：原理、模型与训练

引言人工智能领域的快速发展，带来了许多强大的语言模型。LLaMA 2 是其中之一，以其出色的性能和灵活的应用能力，吸引了广泛关注。这篇文章将带你深入了解 LLaMA 2 的原理、模型架构和训练过程，帮助你全面掌握这一前沿技术。什么是LLaMA...

AIGC 2024-07-10 人工智能

1254阅读

【AI原理解析】— 文心一言模型

目录模型架构 Transformer模型编码器-解码器结构训练过程预训练微调关键技术知识增强上下文感知个性化生成推理与生成应用场景问答系统文本生成对话系统模型架构 Trans...

人工智能 2024-07-04 人工智能

1272阅读

【小沐学AI】Python实现语音识别（Whisper-Web）

文章目录 1、简介 2、下载 2.1 openai-whisper 2.2 whisper-web 结语 1、简介 https://openai.com/index/whisper/ Whisper 是一种自动语音识别（A...

生成式AI 2024-07-01 人工智能

1091阅读

大模型算法(一)：从Transformer到ViT再到LLaMA

单任务/单领域模型深度学习最早的研究集中在针对单个领域或者单个任务设计相应的模型。对于CV计算机视觉领域，最常用的模型是CNN卷积模型。其中针对计算机视觉中的不同具体任务例如分类任务，目标检测任务，图像分割任务，以CNN作为骨干backbone，加...

AIGC 2024-06-11 人工智能

1219阅读

DiffMap：首个利用LDM来增强高精地图构建的网络

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文标题： DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者： Peijin Jia, Tuo...

大数据 2024-05-27 人工智能

955阅读

AI绘图Stable Diffusion中关键技术：U-Net的应用

你好，我是郭震引言在人工智能和深度学习的迅猛发展下，图像生成技术已经取得了令人瞩目的进展。特别是，Stable Diffusion模型以其文本到图像的生成能力吸引了广泛关注。本文将深入探讨Stable Diffusion中一个关键技术——...

AIGC 2024-05-26 人工智能

1229阅读

综述170篇「自监督学习」推荐算法，港大发布SSL4Rec：代码、资料库全面开源！

推荐系统对于应对信息过载挑战至关重要，它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展，提升了对用户行为和偏好的洞察力。然而，由于数据稀疏性的问题，传统的监督学习方法在实际应用中面临挑战，这限制了它们有效学习用户表示的...

大数据 2024-05-09 人工智能

806阅读

五种常用于LLM的令牌遮蔽技术介绍以及Pytorch的实现

本文将介绍大语言模型中使用的不同令牌遮蔽技术，并比较它们的优点，以及使用Pytorch实现以了解它们的底层工作原理。令牌掩码Token Masking是一种广泛应用于语言模型分类变体和生成模型训练的策略。BERT语言模型首先使用，并被用于许多变体(Ro...

AIGC 2024-04-09 人工智能

876阅读

太全了！多模态深度学习的综述！

1.介绍我们对世界的体验是多模态的 —— 我们看到物体，听到声音，感觉到质地，闻到气味，尝到味道。模态是指某件事发生或经历的方式，当一个研究问题包含多个模态时，它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展，它需要能够同时解释这些...

人工智能 2024-04-08 人工智能

1025阅读

TOXCL：用于检测和解释隐性有毒言论的统一AI框架

社交媒体上的毒性言论可能会像野火般蔓延，特别是针对个人和边缘化群体。明显的仇恨言论相对容易被发现，但隐含毒性——依赖于刻板印象和编码语言而不是明显的侮辱——提出了更为棘手的挑战。如何训练人工智能系统不仅能够检测到这种隐晦的毒性，还能解释为何它是有害的呢?...

生成式AI 2024-03-28 人工智能

1028阅读

AIGC实战——Transformer模型

AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结系列链接 0. 前言我们在 GPT (Generative Pre-trained Transfo...

AIGC 2024-03-26 人工智能

981阅读

chatGPT的耳朵！OpenAI的开源语音识别AI：Whisper ！

语音识别是通用人工智能的重要一环！可以说是AI的耳朵！它可以让机器理解人类的语音，并将其转换为文本或其他形式的输出。语音识别的应用场景非常广泛，比如智能助理、语音搜索、语音翻译、语音输入等等。然而，语音识别也面临着很多挑战，比如不同的语言、口音...

人工智能 2024-03-21 人工智能

1056阅读

DECO: 纯卷积Query-Based检测器超越DETR！

本文经自动驾驶之心公众号授权转载，转载请联系出处。标题：DECO: Query-Based End-to-End Object Detection with ConvNets 论文：https://arxiv.org/pdf/2312.13735...

生成式AI 2024-03-19 人工智能

888阅读

语音转字幕：Whisper模型的功能和使用

? 作者：知识浅谈，CSDN签约讲师，CSDN博客专家，华为云云享专家，阿里云专家博主 ? 擅长领域：全栈工程师、爬虫、ACM算法 ? 公众号：知识浅谈 ?语音转字幕：Whisper模型的功能和使用? 使用到的工具和模型: 公众号知识浅谈回复 w...

大数据 2024-03-16 人工智能

1324阅读

谷歌发布最新「读屏」AI！PaLM 2-S自动生成数据，多项理解任务刷新SOTA

【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型，能够完成各种屏幕QA问答、总结摘要等任务。每个人想要的大模型，是真·智能的那种...... 这不，谷歌团队就做出来了一个强大的「读屏」AI。研究人员...

生成式AI 2024-03-05 人工智能

902阅读

扩散模型的发展过程梳理多个扩散模型理论知识总结/DDPM去噪扩散概率/IDDPM/DDIM隐式去噪/ADM/SMLD分数扩散/CGD条件扩散/Stable Diffusion稳定扩散/LM

前言 1.最近发现自己光探索SDWebUI功能搞了快两个月，但是没有理论基础后面科研路有点难走，所以在师兄的建议下，开始看b站视频学习一下扩散模型，好的一看一个不吱声，一周过去了写个博客总结一下吧，理理思路。不保证下面的内容完全正确，只能说是一个菜鸟的思...

AIGC 2024-02-15 人工智能

2157阅读

将AI融入CG特效工作流；对谈Dify创始人张路宇；关于Llama 2的一切资源；普林斯顿LLM高阶课程；LLM当前的10大挑战 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 将AI融入CG特效工作流，体验极致的效率提升 BV1pP411r7HY 这是 B站UP主 @特效小哥studio 和 @拓星研究所联...

大数据 2024-02-12 人工智能

1168阅读

香港最大AI诈骗案：Deepfake换脸「英国CFO」，直接骗走公司2亿港币

【新智元导读】香港一家跨国公司员工，被骗子邀请进了用Deepfake做的「高管视频会议」中，下令让他转了2亿港币到不知名中账户，5天之后才发现被骗了。这几天，古老的AI应用——「AI换脸」多次破圈，屡屡登上热搜。先是网上充斥的大量泰勒斯威夫特的「AI艳...

人工智能 2024-02-05 人工智能

869阅读

香港最大AI诈骗案！Deepfake换脸「英国CFO」，直接骗走公司2亿港币

这几天，古老的AI应用——「AI换脸」多次破圈，屡屡登上热搜。先是网上充斥的大量泰勒斯威夫特的「AI艳照」，逼得X（原推特）只能直接屏蔽了所有有关「Tylor Swift」的搜索。而今天香港警方向社会公布了一起更离谱的诈骗案件：一家英国跨国企业的中...

AIGC 2024-02-05 人工智能

854阅读

登Nature子刊，滑铁卢大学团队评论「量子计算机+大语言模型」当下与未来

模拟当今量子计算设备的一个关键挑战，是学习和编码量子比特之间发生的复杂关联的能力。基于机器学习语言模型的新兴技术已经显示出学习量子态的独特能力。近日，加拿大滑铁卢大学的研究人员在《Nature Computational Science》发表题为《La...

AIGC 2024-02-04 人工智能

911阅读

基于医疗领域数据微调LLaMA——ChatDoctor模型

文章目录 ChatDoctor简介数据构建和训练过程建立外部知识库 ChatDoctor相比ChatGPT有什么优势？ ChatDoctor的效果代码解读 train_lora.py文件解读微调实战下载仓库并进入目录创建con...

人工智能 2024-02-03 人工智能

1130阅读

【网安AIGC专题10.19】论文6（顶会ISSTA 2023）：提出新Java漏洞自动修复数据集：数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会

How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面摘要贡献发现介绍背景：漏洞修复需求和Java漏洞修复方向动机方法贡献...

AIGC 2024-02-01 人工智能

1269阅读

迈向分割的大一统！OMG-Seg：一个模型搞定所有分割任务

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者个人思考图像分割已经从单任务分割走到了语义分割、实例分割、全景分割三种分割任务的统一；大模型以及多模态的发展又带来了文本和图像统一，使得跨模态端到端成为可能；追求更高级、更全面...

生成式AI 2024-01-24 人工智能

1187阅读

AIGC的底层核心结构Transformer是如何彻底改变NLP游戏规则的？OJAC近屿智能带你一探究竟

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 没有Transformer，就没有NLP的突破，听起来有些夸张，但事实确实如此。什么是Transformer？Transforme...

生成式AI 2024-01-21 人工智能

921阅读

stable diffusion原理

1、Latent space 隐空间是压缩数据的一个表示。数据压缩的目的是学习数据中较重要的信息。以编码器-解码器网络为例，首先使用全卷积神经网(FCN 络学习图片特征，我们将特征提取中对数据的降维看作一种有损压缩。但是由于解码器需要重建(reconst...

生成式AI 2024-01-18 人工智能

847阅读

请查收使用OpenAI的Whisper进行语音识别的攻略

Whisper是一种令人激动的新型语言模型，采用了全新的语音识别方法，即使是低质量的音频，Whisper也能产生高质量的结果，并且对各种声音和语言的适应性极强，无需进行微调。 Whisper是开源的，有一系列可用的模型尺寸，可以作为众多语音转文字应用的有...

AIGC 2024-01-16 人工智能

1431阅读

【生成模型】Stable Diffusion原理+代码

文章目录前言一、Latent space 二、AutoEncoder 和 VAE 1.AutoEncoder: 2.VAE：三、Diffusion扩散模型 1.前向过程 2.逆向过程四、多模态 cross attention 五...

生成式AI 2024-01-16 人工智能

1588阅读

GPT-5前瞻！GPT-5将具备哪些新能力？

Sam Altman在整个AI领域，乃至整个科技领域都被看作是极具影响力的存在，而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感，他甚至被《时代》杂志评为“2023年度CEO”。也正因此， Sam Altman的一条推文，...

大数据 2024-01-15 人工智能

992阅读

WAIC2023| AIGC究竟在向善还是向恶而行？

目录一、常见图像篡改技术二、传统篡改图像检测方法 2.1、基于光源和噪声的拼接图像篡改检测方法 2.2、基于马尔科夫特征的检测方法三、基于深度学习的图像篡改检测方法 3.1、基于Fisher编码和SVM模型的方法 3.2、基于...

AIGC 2024-01-15 人工智能

1006阅读

【计算机视觉 | 目标检测】术语理解9：AIGC的理解，对比学习，解码器，Mask解码器，耦合蒸馏，半耦合，图像编码器和组合解码器的耦合优化

文章目录一、AIGC的理解二、对比学习三、解码器四、Mask解码器五、耦合蒸馏六、半耦合七、图像编码器和组合解码器的耦合优化一、AIGC的理解 AIGC指的是使用人工智能技术自动生成的各类数字内容,包括文本、图像、...

AIGC 2024-01-14 人工智能

916阅读

Stable Diffusion-生式AI的新范式

! 扩散模型（Stable Diffusion 现在是生成图像的首选模型。由于扩散模型允许我们以提示( prompts 为条件生成图像，我们可以生成我们所选择的图像。在这些文本条件的扩散模型中，稳定扩散模型由于其开源性而最为著名。在这篇文章中，我们将...

人工智能 2024-01-14 人工智能

933阅读

OpenAI的人工智能语音识别模型Whisper详解及使用

1 whisper介绍拥有ChatGPT语言模型的OpenAI公司，开源了 Whisper 自动语音识别系统，OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型，...

生成式AI 2024-01-14 人工智能

3397阅读

AIGC之文本内容生成概述（下）——Transformer

在上一篇文章中，我们一口气介绍了LSTM、Word2Vec、GloVe、ELMo等四种模型的技术发展，以及每种模型的优缺点与应用场景，全文超过一万字，显得冗长且繁杂，在下文部分我们将分开介绍Transformer、BERT、GPT1/GPT2/GPT3/C...

生成式AI 2024-01-08 人工智能

1051阅读

AIGC 综述 2023：A History of Generative AI from GAN to ChatGPT

GAI：发展历史，核心技术，应用领域以及未来发展摘要 1、引言 1.1、主要贡献 1.2、组织结构 2、生成式AI的发展历史 2.1、NLP领域的发展 2.2、CV领域的发展 2.3、CV与NLP的融合 3、AIGC的核心技术基础...

人工智能 2024-01-08 人工智能

1493阅读

【原创】用 VisualGLM 进行AIGC多模识别和内容生成

最近几个月，整个AI行业的LLM（大语言模型）蓬勃发展，除了过去传统的纯文字的多模态能力的视觉语言模型，如 GPT-4，ImageBind等表现令人印象深刻。 ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日，智谱...

人工智能 2023-11-09 人工智能

1035阅读