注意力第11页 - AIGC资讯

Sora新视频只发TikTok：OpenAI 4天涨粉10万

Sora新视频，变成“抖音独占”了。悄无声息，OpenAI正式杀入TikTok，加上洗脑配乐直接让人刷到停不下来，疯狂引流吸粉中: 短短4天，涨粉10万，50万赞——这还是不打枪不宣传的情况下。这以后，人类创作者还怎么玩? Sora新视频，只发Tik...

人工智能 2024-02-21 人工智能

766阅读

Llama深入浅出

前方干货预警：这可能是你能够找到的最容易懂的最具实操性的学习开源LLM模型源码的教程。本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼。并且训练它来实现一个有趣的实例：两数之和。输入...

生成式AI 2024-02-21 人工智能

817阅读

【AIGC】大语言模型

大型语言模型，也叫大语言模型、大模型（Large Language Model，LLM；Large Language Models，LLMs）什么是大型语言模型大型语言模型（LLM）是指具有数千亿（甚至更多）参数的语言模型，它们是通过在大规模文本数...

生成式AI 2024-02-20 人工智能

1100阅读

大型多视角高斯模型LGM：5秒产出高质量3D物体，可试玩

为满足元宇宙中对 3D 创意工具不断增长的需求，三维内容生成（3D AIGC）最近受到相当多的关注。并且，3D 内容创作在质量和速度方面都取得了显著进展。尽管当前的前馈式生成模型可以在几秒钟内生成 3D 对象，但它们的分辨率受到训练期间所需密集计算的限...

AIGC 2024-02-20 人工智能

842阅读

RNN模型挑战Transformer霸权！1%成本性能比肩Mistral-7B，支持100+种语言全球最多

在大模型内卷的同时，Transformer的地位也接连受到挑战。近日，RWKV发布了Eagle 7B模型，基于最新的RWKV-v5架构。 Eagle 7B在多语言基准测试中，击败了所有的同级别模型，在单独的英语测试中，也和表现最好的模型基本打平。同时...

人工智能 2024-02-20 人工智能

843阅读

AIGC音视频工具分析和未来创新机会思考

编者按：相较于前两年，2023年音视频行业的使用量增长缓慢，整个音视频行业遇到瓶颈。音视频的行业从业者面临着相互竞争、不得不“卷”的状态。我们需要进行怎样的创新，才能从这种“卷”的状态中脱离出来？LiveVideoStack 2023上海站邀请到了P...

人工智能 2024-02-18 人工智能

953阅读

扩展说明: 指令微调 Llama 2

这篇博客是一篇来自 Meta AI，关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集，有了它，我们则可以使用自己的指令来微调 Llama 2 基础模型。目标是构建一个能够基于输入内容来生成指令的模型。这么做背后的逻辑是，模型如此...

AIGC 2024-02-17 人工智能

1060阅读

Stable Diffusion 笔记一：网络结构拆解

SD由三大组件组成：VAE，CLIP，Unet。一VAE： VAE是Variational Autoencoder的缩写，中文名变分自编码器，是一种基于深度学习的生成模型。１潜空间图片与像素图片：像素图片是正常使用的图片，通常包含主体的物体人...

人工智能 2024-02-17 人工智能

1342阅读

AIGC内容分享(二)：全球大模型技术与应用分析

目录前言人工智能技术回顾 AIGC近期动态梳理 1. 国内动态 2. 国外动态 3. OpenAI的关键动作 4. AIGC的技术变革 AIGC的关键应用 1. AIGC应用背后的驱动力 2. AIGC的三大原能力 3. AI...

生成式AI 2024-02-17 人工智能

1012阅读

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了...

人工智能 2024-02-16 人工智能

1055阅读

基本概念:什么是ChatGPT和AIGC？

1.背景介绍 1. 背景介绍自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge，深度学习技术开始引以为奎。随着算法的不断发展和优化，深度学习技术已经应用...

生成式AI 2024-02-16 人工智能

1038阅读

LLMs之Llama2 70B：使用 PyTorch FSDP 微调 Llama 2 70B实现全部过程讲解之详细攻略

LLMs之Llama2 70B：使用 PyTorch FSDP 微调 Llama 2 70B实现全部过程讲解之详细攻略目录使用 PyTorch FSDP 微调 Llama 2 70B 引言 FSDP 工作流使用的硬件微调 LLa...

生成式AI 2024-02-16 人工智能

1875阅读

只需任意一张人物图片，就可以生成该人物的科目三舞蹈视频 - AIGC 中的 Image-to-Video 技术

这是儿子寒假在家，我和他一起玩阿里通义千问后的一篇笔记。通义千问有一个全民舞王的功能。选择一个舞蹈模版，然后上传一张人物全身照片，即可生成一段10秒钟左右的视频。卡通人物的图片也行。比如我用了弗利萨大王和沙鲁的图片：点击立即生成按钮，...

生成式AI 2024-02-16 人工智能

957阅读

Stable Diffusion结构解析-以图像生成图像（图生图，img2img）

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） AIGC专栏3——Stable Diffusion结构解析-以图像生成图像（图生图，img2img）为例学习...

人工智能 2024-02-16 人工智能

1496阅读

LLaMA 入门指南

LLaMA 入门指南 LLaMA 入门指南 LLaMA的简介 LLaMA模型的主要结构 Transformer架构多层自注意力层前馈神经网络 Layer Normalization和残差连接 LLaMA模型的变体 Base版本 La...

人工智能 2024-02-15 人工智能

1570阅读

Stable Diffusion InstantID 炸裂！只需要一张图就可以换脸｜详细教程

最近AI换脸又火起来了，小红书 InstantX 团队发布了一款最新的换脸技术 InstantID 和之前的主流的训练 lora 换脸不同，InstantID 只需要上传一张图就可以实现换脸以及姿势替换！一 InstantID 介绍 I...

大数据 2024-02-12 人工智能

1688阅读

ChatGPT研究报告：AIGC带来新一轮范式转移

本文约4000字，目标是快速建立AIGC知识体系，含有大量的计算专业名词，建议阅读同时扩展搜索。一、行业现状 1、概念界定区别于PGC与UGC不同的，AIGC是利用人工智能技术自动生成内容的新型生产方式。 2、数据模...

大数据 2024-02-12 人工智能

917阅读

上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务

本文首发于微信公众号 CVHub，未经授权不得以任何形式售卖或私自转载到其它平台，违者必究！ Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...

人工智能 2024-02-11 人工智能

1111阅读

用通俗易懂的方式讲解：十分钟读懂 Stable Diffusion 运行原理

AIGC 热潮正猛烈地席卷开来，可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度，特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性，也在逐渐改变一部分行业的生产模式。惊艳其出色表...

大数据 2024-02-11 人工智能

1455阅读

Stable Diffusion结构解析-以图像生成图像！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） AIGC专栏3——Stable Diffusion结构解析-以图像生成图像（图生图，img2img）为例学习...

生成式AI 2024-02-11 人工智能

902阅读

羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读

论文地址：https://arxiv.org/pdf/2307.09288.pdfd 代码地址：GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model...

大数据 2024-02-10 人工智能

1706阅读

酒精和肠内外健康：有帮助还是有害？

谷禾健康酒精与健康饮酒作为一种特殊的文化形式，在我们国家有其独特的地位，在几千年的发展中，酒几乎渗透到日常生活、社会经济、文化活动之中。据2018年发表的《中国饮酒人群适量饮酒状况》白皮书数据显示，中国饮酒人...

AIGC 2024-02-10 人工智能

973阅读

AIGC 语言大模型研究报告

AIGC 研究报告这份报告可以被划分为两大部分。第一部分集中于ChatGPT的发展和运作原理，为了增强理解，我们将先探讨自然语言处理的历史发展。第二部分主要聚焦于由大模型引领的新的研究领域，并深入介绍在每个领域中可以进行的具体研究工作及思...

生成式AI 2024-02-10 人工智能

1068阅读

AIGC：人工智能生成技术的新兴领域

1.背景介绍 1. 背景介绍人工智能生成技术(AIGC 是一种利用机器学习和自然语言处理等技术来自动生成自然语言文本或其他形式的内容的技术。这种技术在近年来取得了显著的进展，为各种应用场景提供了强大的支持。本文将从背景、核心概念、算法原理、...

AIGC 2024-02-09 人工智能

1457阅读

AI绘画Stable Diffusion原理之扩散模型DDPM

前言传送门： stable diffusion：Git｜论文 stable-diffusion-webui：Git Google Colab Notebook部署stable-diffusion-webui：Git kaggle...

人工智能 2024-02-08 人工智能

1014阅读

【AI绘画】Stable Diffusion扩散模型 + Consistency一致性模型小白必看！！！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） 1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史...

大数据 2024-02-08 人工智能

1310阅读

全网最全stable diffusion模型讲解！快来！！小白必收藏！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取） AI模型最新展现出的图像生成能力远远超出人们的预期...

人工智能 2024-02-08 人工智能

1389阅读

Whisper 整体架构图

Attention 注意力机制模块，兼容自注意力和交叉注意力。 AttentionBlock Transformer 模块，包含一个自注意力，一个交叉注意力（可选）和一个 MLP 模块。 AudioEncoder+TextDeco...

AIGC 2024-02-07 人工智能

852阅读

大语言模型之LlaMA系列- LlaMA 2及LLaMA2_chat(上)

LlaMA 2是一个经过预训练与微调的基于自回归的transformer的LLMs，参数从7B至70B。同期推出的Llama 2-Chat是Llama 2专门为对话领域微调的模型。在许多开放的基准测试中Llama 2-Chat优于其他开源的聊天模型，此外...

生成式AI 2024-02-07 人工智能

1499阅读

语言模型大战：GPT、Bard与文心一言，谁才是王者？

如何对GPT-3.5、GPT-4、Bard、文心一言、通义千问的水平进行排序？在聊技术原理之前我们来先看看几个产品的团队背景一、团队背景 1.1、ChatGPT ChatGPT团队的成员大多具有计算机科学、人工智能、自然语言处理、机器学...

AIGC 2024-02-07 人工智能

968阅读

深入探索 Stable Diffusion：AI图像创新的新纪元

深入探索 Stable Diffusion：AI图像创新的新纪元介绍 Stable Diffusion 的核心功能和应用场景 Stable Diffusion 架构解析深入 Stable Diffusion 的关键组件变分自编码器（VA...

大数据 2024-02-06 人工智能

1187阅读

阿里Animate Anyone怎么用 AI生成动画视频软件手机下载方法

Animate Anyone是一款专为将静态图像转换为角色视频而设计的先进工具。它利用了扩散模型的强大功能，提供了一个定制的框架，可以为任意角色制作动画。这项技术特别适用于时尚视频合成和人类舞蹈生成等领域。点击前往Animate Anyone体验入口...

AIGC 2024-02-06 人工智能

1347阅读

AI读心术再升级！一副眼镜直接控制波士顿机器狗，脑控机器人成真

还记得之前的AI读心术吗？最近，「心想事成」的能力再次进化， ——人类可以通过自己的想法直接控制机器人了！来自麻省理工的研究人员发表了Ddog项目，通过自己开发的脑机接口（BCI）设备，控制波士顿动力的机器狗Spot。狗狗可以按照人类的想法，移动到特...

AIGC 2024-02-06 人工智能

946阅读

【AIGC-图片生成视频系列-6】SSR-Encoder：用于主题驱动生成的通用编码器

目录一. 贡献概述二. 方法详解 a 训练阶段 b 推理生成阶段：三. 综合结果四. 注意力可视化五. 选择性主题驱动图像生成六. 人体图像生成七. 可推广到视频生成模型八. 论文九. 个人思考稳定扩散（S...

生成式AI 2024-02-06 人工智能

878阅读

chatgpt和文心一言哪个更好用

ChatGPT和文心一言都是近年来备受关注的人工智能语言模型。它们在智能回复、语言准确性、知识库丰富度等方面都有着较高的表现。然而，它们各自也有自己的特点和优势。在本文中，我们将从这几个方面对这两个模型进行比较，以帮助您更好地了解它们的特点和优劣。一、...

大数据 2024-02-06 人工智能

1084阅读

2023-12-12 AIGC-AI工具的基本工作原理

摘要: 2023-12-12 AIGC-AI工具的基本工作原理 AI工具的基本工作原理 AI工具的基本工作原理涉及到一系列复杂的技术和算法。这些原理可以根据不同类型的AI工具进行概括，包括机器学习、自然语言处理、图像识别等。以下是一些关键的A...

AIGC 2024-02-06 人工智能

1261阅读

罕见！苹果开源图片编辑神器MGIE，要上iPhone?

拍张照片，输入文字指令，手机就开始自动修图？这一神奇功能，来自苹果刚刚开源的图片编辑神器「MGIE」。把背景中的人移除在桌子上添加披萨最近一段时间，AI 在图片编辑这一应用上取得了不小的进展。一方面，在 LLM 的基础上，多模态大模型（MLL...

AIGC 2024-02-05 人工智能

933阅读

两亿参数时序模型替代LLM？谷歌突破性研究被批「犯新手错误」

最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting（用于时间序列预测的仅解码器基础模型）」。简而言之，...

人工智能 2024-02-05 人工智能

920阅读

音频秒生全身虚拟人像，AI完美驱动面部肢体动作！UC伯克利Meta提出Audio2Photoreal

就在最近，Meta和UC伯克利联合提出了一种全新的虚拟人物形象生成的方法—— 直接根据音频生成全身人像，效果不仅逼真，还能模拟出原音频中包含的细节，比如手势、表情、情绪等等。图片论文地址：https://arxiv.org/abs/2401.0188...

人工智能 2024-02-05 人工智能

977阅读

美国博士小哥打败女友的AI男友！7页论文让LLM降智，训出「负分男友」成功挽回

女友爱上AI了，怎么破？一位自称来自Cranberry-Lemon大学应用心理机器学习系的Chad Broman博士最近表示，自己已经和女友Tiffany分手8个月了。虽然很享受单身的自由，但身边没有女友的日子，连玩快艇都少了很多滋味。他一直想找机...

大数据 2024-02-05 人工智能

790阅读

Eagle7B: 基于RWKV-v5架构、跨足100多种语言的7.52B参数AI模型

随着人工智能的发展，大型语言模型在各个领域开始受到广泛关注和应用。这些模型在数十亿级别的数据规模上进行训练，涵盖了健康、金融、教育、娱乐等多个领域，从自然语言处理和翻译到其他任务都发挥着重要作用。最近，研究人员开发了Eagle7B，这是一个具有惊人75...

大数据 2024-02-05 人工智能

829阅读

首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路！

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者的一些个人思考在自动驾驶领域，随着BEV-based子任务/端到端方案的发展，高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点，“高质量”可以解耦成三个方面：不同维度...

人工智能 2024-02-05 人工智能

1214阅读

CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗？｜ DALL-E 3、Stable Diffusion等20+ 图像生成模型综述

随着科技飞速发展，CES（国际消费电子展）已然成为全球科技产业的风向标，每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会，不难发现其亮点纷呈，其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点，各大厂商纷纷展...

人工智能 2024-02-04 人工智能

1157阅读

生成式AI监管：“深度伪造技术”是否表明大语言模型的自由意志？

当我们给生成式AI特定风格的提示词时，也意味着我们希望它能够发挥想象力。要求人工智能进行想象是承认它有这样做的意愿，而不仅仅是有这样做的能力（或拥有这样做的内容）。这种意愿并不能设定在一本有图示的书中，因此我们不能告诉它打开某一页，让它自己照着步骤做。汽...

人工智能 2024-02-04 人工智能

917阅读

登Nature子刊，滑铁卢大学团队评论「量子计算机+大语言模型」当下与未来

模拟当今量子计算设备的一个关键挑战，是学习和编码量子比特之间发生的复杂关联的能力。基于机器学习语言模型的新兴技术已经显示出学习量子态的独特能力。近日，加拿大滑铁卢大学的研究人员在《Nature Computational Science》发表题为《La...

AIGC 2024-02-04 人工智能

908阅读

AIGC面经大全（持续更新）

目录 DDPM算法原理部分： DDIM算法原理部分：⾼阶采样⽅案：特征编码篇： Stable Diffusion篇： SDXL篇：⼤模型微调篇：控制模型篇：适配器篇： DDPM算法原理部分：简述DDP...

AIGC 2024-02-04 人工智能

1474阅读

【AIGC-图片生成视频系列-3】AI视频随心而动：MotionCtrl的相机运动控制和物体运动控制

目录一. 项目简介二. 主要贡献三. 摘要四. 实现方法和管线五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...

AIGC 2024-02-04 人工智能

946阅读

聊一聊AIGC

“UGC不存在了”——借鉴自《三体》 ChatGPT 的横空出世将一个全新的概念推上风口——AIGC（ AI Generated Content）。 GC即创作内容（Generated Content），和传统的UGC、PGC，...

生成式AI 2024-02-04 人工智能

1342阅读

【CV】稳定扩散模型（Stable Diffusion）

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自...

人工智能 2024-02-03 人工智能

1017阅读