生成任务第4页 - AIGC资讯

100天，3个版本，他们让营销AIGC起来了

“18权益加磅，省的不止一点点！”打开京东金融APP，一则热闹的营销头图跃入眼帘，你可能意识不到，这则堪比设计师水准的物料源自大模型的手笔。今年6.18和11.11，京东金融超过30%的资源位营销素材由AIGC自动生成，这一水平在亿级用户量的应...

生成式AI 2024-01-25 人工智能

852阅读

扩散模型更懂复杂提示词！Pika北大斯坦福开源新框架，利用LLM提升理解力

Pika北大斯坦福联手，开源最新文本-图像生成/编辑框架！无需额外训练，即可让扩散模型拥有更强提示词理解能力。面对超长、超复杂提示词，准确性更高、细节把控更强，而且生成图片更加自然。效果超越最强图像生成模型Dall·E 3和SDXL。比如要求图片...

生成式AI 2024-01-24 人工智能

868阅读

[论文精读] 自条件图像生成 - 【恺明大神新作，AIGC 新基准】

论文导读: 论文背景: 2023年8月，AI大神何恺明在个人网站宣布，2024年将加入MIT担任教职，回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文，论文一作本科毕业于清华姚班，二作为MIT电气工程与计算机科学系教授，今年的斯...

生成式AI 2024-01-23 人工智能

1018阅读

DALL·E 2 论文阅读笔记

《Hierarchical Text-Conditional Image Generation with CLIP Latents》 Paper: https://cdn.openai.com/papers/dall-e-2.pdf Proj...

人工智能 2024-01-23 人工智能

1050阅读

消灭「幻觉」！谷歌全新ASPIRE方法让LLM给自己打分，效果碾压10x体量模型

大模型的「幻觉」问题马上要有解了？威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统，可以让大模型对自己的输出给出评分。如果用户看到模型的生成的结果评分不高，就能意识到这个回复可能是幻觉。如果系统可以进一步筛选评分的结果进行输...

人工智能 2024-01-23 人工智能

902阅读

文心一言 vs. ChatGPT：哪个更胜一筹？

文心一言 vs. ChatGPT：从简洁美到深度思考的文本生成之旅近年来，文本生成工具的崛起使得人们在表达和沟通方面拥有了更多的选择。在这个领域中，文心一言和ChatGPT作为两个备受瞩目的工具，各自以独特的优势展现在用户面前。本文将深入对比这两者，...

人工智能 2024-01-23 人工智能

854阅读

Video-LLaMA 论文精读

Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding video-LLaMA 一种用于视频理解的指令调整视听语言模型引言 ...

大数据 2024-01-22 人工智能

1010阅读

一文了解AIGC与ChatGPT

关注微信公众号掌握更多技术动态 --------------------------------------------------------------- 一、AIGC简介 1.AIGC基础 (1 AIGC是什么 AIGC是人...

人工智能 2024-01-22 人工智能

1608阅读

LCM-LoRA：通用stable diffusion 加速模块！2023.11.13顶会论文速递！

整理：AI算法与图像处理欢迎关注公众号 AI算法与图像处理，获取更多干货：推荐微信交流群现已有2000+从业人员交流群，欢迎进群交流学习，微信：nvshenj125 B站最新成果demo分享地址：https://s...

大数据 2024-01-21 人工智能

1094阅读

AIGC、ChatGPT、GPT系列？我的认识

AIGC（AI generated content），新型内容生产方式。AIGC是利用人工智能技术来生成内容，也就是，它可以用输入数据生成相同或不同类型的内容，比如输入文字、生成文字，输入文字、生成图像等。 GPT-3是生成型的预训练变换模型，是...

大数据 2024-01-20 人工智能

916阅读

UniVG官网体验入口 AI多模态视频生成系统在线使用地址

UniVG是一款革命性的多模态视频生成系统，专门设计用于处理各种视频生成任务。它支持从文本和图像模态到视频的转换，通过采用多条件交叉注意力和偏置高斯噪声，UniVG实现了在视频生成领域的高自由度和低自由度的创新。该系统在公共学术基准MSR-VTT上实现了最...

人工智能 2024-01-19 人工智能

860阅读

AI绘画与多模态原理解析：从CLIP到DALLE1/2、DALLE 3、Stable Diffusion、SDXL Turbo、LCM

前言终于开写本CV多模态系列的核心主题：stable diffusion相关的了，为何执着于想写这个stable diffusion呢，源于三点去年stable diffusion和midjourney很火的时候，就想写，因为经常被刷屏，但那会时...

生成式AI 2024-01-19 人工智能

3046阅读

AIGC：使用生成对抗网络GAN实现MINST手写数字图像生成

1 生成对抗网络生成对抗网络（Generative Adversarial Networks, GAN）是一种非常经典的生成式模型，它受到双人零和博弈的启发，让两个神经网络在相互博弈中进行学习，开创了生成式模型的新范式。从 2017 年以后，GAN相...

AIGC 2024-01-18 人工智能

880阅读

如何将知识图谱与AIGC结合？京东是这么做的

一、导言首先介绍一下京东在电商场景下 AIGC 方面的探索。这是一个商品营销文案自动生成的全景图，自下而上首先是商品的输入信息。输入信息是异构多源的，包括商品的商详页里的图片、文本、商品的标题以及商品的知识图谱。通用的知识图谱是三元组的形式，...

大数据 2024-01-18 人工智能

1089阅读

「文生图」再升级！学习个性化参照，无限生成多样图片，轻松设计玩具建筑

最近，来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。这种方法可以让任何基于文字提示的生成模型（比如文生图、文生3D等），通过一组参照图片来学习对应的视觉属性共性和变化的文本提示分布。...

生成式AI 2024-01-16 人工智能

1005阅读

OpenVINO异步Stable Diffusion推理优化方案

文章目录 Stable Diffusion 推理优化背景技术讲解：异步优化方案思路：异步推理优化原理 OpenVINO异步推理Python API...

生成式AI 2024-01-16 人工智能

1011阅读

AIGC for code(text-to-codeAIGC/AI生成代码/生成式AI之代码生成/AI编程工具/自动编程/自动生成代码/智能编程工具/智能编程系统)

AIGC，Artificial Intelligence Generated Content，人工智能生成内容 AIGC for code，AI生成代码 1 Github Copilot 1.1 简介 Copilot是由微软的子公司Github与o...

生成式AI 2024-01-15 人工智能

1044阅读

【网安AIGC专题10.11】论文1：生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)

论文1：Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面论文总结背景知识介绍语言模型双向语言模型单向语言模型自动程序修复（...

大数据 2024-01-15 人工智能

965阅读

即插即用，完美兼容：SD社区的图生视频插件I2V-Adapter来了

图像到视频生成（I2V）任务旨在将静态图像转化为动态视频，这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息，同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一...

生成式AI 2024-01-15 人工智能

881阅读

视频场景图生成任务新SOTA！中山大学提出全新时空知识嵌入框架，登顶刊TIP'24

视频场景图生成（VidSGG）旨在识别视觉场景中的对象并推断它们之间的视觉关系。该任务不仅需要全面了解分散在整个场景中的每个对象，还需要深入研究它们在时序上的运动和交互。最近，来自中山大学的研究人员在人工智能顶级期刊IEEE T-IP上发表了一篇论文...

大数据 2024-01-13 人工智能

838阅读

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

文章目录一、 GPT系列 1.1 GPTs（OpenAI，2018——2020） 1.2 InstructGPT（2022-3） 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT（2022.11.30） 1.4 ChatG...

AIGC 2024-01-09 人工智能

1304阅读

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

将一幅图像转换为3D的方法通常采用Score Distillation Sampling（SDS）的方法，尽管结果令人印象深刻，但仍然存在多个不足之处，包括多视角不一致、过度饱和、过度平滑的纹理，以及生成速度缓慢等问题。为了解决这些问题，北京大学、新加坡...

AIGC 2024-01-08 人工智能

867阅读

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研究团队训练了一个CodeOcean数据集，包含了2万个指令实例的数据集，以及4个通用代码相关任务。与此同时，研究人员微调了一个代码大模型WaveCoder。论文地址：https://...

大数据 2024-01-08 人工智能

909阅读

AIGC 综述 2023：A History of Generative AI from GAN to ChatGPT

GAI：发展历史，核心技术，应用领域以及未来发展摘要 1、引言 1.1、主要贡献 1.2、组织结构 2、生成式AI的发展历史 2.1、NLP领域的发展 2.2、CV领域的发展 2.3、CV与NLP的融合 3、AIGC的核心技术基础...

人工智能 2024-01-08 人工智能

1482阅读

1张图2分钟转3D！纹理质量、多视角一致性新SOTA｜北大出品

只需两分钟，玩转图片转3D！还是高纹理质量、多视角高一致性的那种。不管是什么物种，输入时的单视图图像还是这样婶儿的：两分钟后，3D版大功告成： △上，Repaint123（NeRF）；下，Repaint123（GS）新方法名为Repaint...

AIGC 2024-01-08 人工智能

845阅读

卧剿，6万字！30个方向130篇！CVPR 2023 最全 AIGC 论文！一口气读完。

一杯奶茶，成为 AIGC+CV 视觉前沿弄潮儿！ 25个方向！CVPR 2022 GAN论文汇总 35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2020...

人工智能 2024-01-07 人工智能

1329阅读

stable diffusion模型讲解

AI模型最新展现出的图像生成能力远远超出人们的预期，直接根据文字描述就能创造出具有惊人视觉效果的图像，其背后的运行机制显得十分神秘与神奇，但确实影响了人类创造艺术的方式。 AI模型最新展现出的图像生成能力远远超出人们的预期，直接根据文字描述就能创造出具有...

人工智能 2024-01-07 人工智能

919阅读

兵马俑跳《科目三》，是我万万没想到的

家人们，火爆全球的魔性舞蹈《科目三》，谁能料到，就连兵马俑也开始跳上了！图片热度还居高不下，瞬间被轰上了热搜，小伙伴们纷纷惊掉了下巴表示“闻所未闻，见所未见”。图片这到底是怎么一回事？原来，是有人借助了阿里之前走红的AI技术——AnimateA...

AIGC 2024-01-07 人工智能

882阅读

攻克图像「文本生成」难题，碾压同级扩散模型！两代TextDiffuser架构深度解析

近年来，文本生成图像领域取得了显著进展，尤其是基于扩散（Diffusion）的图像生成模型在细节层面上展现出逼真的效果。然而，一个挑战仍然存在：如何将文本准确地融入图像。生活中存在大量的「含文本图像」，从广告海报到书籍封面，再到路牌指示，都包含了重要...

生成式AI 2024-01-06 人工智能

910阅读

无需文本标注，TF-T2V把AI量产视频的成本打下来了！华科阿里等联合打造

在过去短短两年内，随着诸如LAION-5B 等大规模图文数据集的开放，Stable Diffusion、DALL-E2、ControlNet、Composer ，效果惊人的图片生成方法层出不穷。图片生成领域可谓狂飙突进。然而，与图片生成相比，视频生成仍存...

生成式AI 2024-01-06 人工智能

817阅读

看见这张图没有，你就照着画：谷歌图像生成AI掌握多模态指令

用图2的风格画图1的猫猫并给它戴上一顶帽子。谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术，多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像，效果堪比 PS 大神抓着你的手助你 P 图。在使用大型语言模型（LLM...

AIGC 2024-01-06 人工智能

831阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

964阅读

Instruct-Imagen官网体验入口 AI多模态图像生成模型软件免费下载地址

Instruct-Imagen是一个多模态图像生成模型，专注于处理异构图像生成任务，并在未知任务中展现出良好的泛化能力。该模型通过引入多模态指令，利用自然语言整合不同模态（如文本、边缘、风格、主题等），标准化丰富的生成意图。它在预训练文本到图像扩散模型上进...

人工智能 2024-01-05 人工智能

894阅读

人工智能生成内容（AIGC）总览记录（认知篇）！！！

文章目录一、AIGC 引入 1.1 AIGC 定义 1.2 AIGC 历史沿革（了解） 1.3 AIGC 技术演进二、AIGC 大模型 2.1 视觉大模型提升 AIGC 感知能力 2.2 语言大模型增强 AIGC 认知能力 2.3 多...

AIGC 2024-01-05 人工智能

1835阅读

终端上的GitHub Copilot以及IDE上的GitHub Copilot

GitHub Copilot Github Copilot文档地址：Github Copilot文档 IDE上的 GithubCopilot VSCode 安装VSCode：如果您还没有安装VSCode，请前往VSCode官方网站下载并安装...

生成式AI 2024-01-04 人工智能

856阅读

HandRefiner：解决AI生图手部畸形难题

HandRefiner是一种可以修正形状不正常的手部图像的方法。在生成图像方面，目前的图像生成模型已经非常出色，但是在生成人类手部的图像时常常会出现问题，例如手指数量不对或者手形怪异。为了解决这个问题，HandRefiner提出了一种条件修补方法，可以在...

生成式AI 2024-01-04 人工智能

944阅读

M2UGen体验入口 AI多模态音乐生成框架免费下载地址

M2UGen是一款结合大语言模型的多模态音乐理解和生成框架，旨在协助用户进行音乐创作。它能同时完成音乐理解和多模态音乐生成任务，为音乐创作、音乐理解研究和音乐应用开发提供了强大的支持。点击前往M2UGen体验入口 M2UGen适用于哪些用户？ M2U...

大数据 2024-01-03 人工智能

910阅读

AIGC产业研究报告2023——视频生成篇

易观：今年以来，随着人工智能技术不断实现突破迭代，生成式AI的话题多次成为热门，而人工智能内容生成（AIGC）的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势，易观对AIGC产业进行了探索并将发布AIG...

大数据 2024-01-02 人工智能

1023阅读

这是GPT-4变笨的新解释

变笨的本质是知识没进脑子。自发布以来，曾被认为是世界上最强大的 GPT-4也经历了多场「信任危机」。如果说今年早些时候那次「间歇式降智」与 OpenAI 重新设计 GPT-4架构有关，前段时间的「变懒」传闻就更搞笑了，有人测出只要告诉 GPT-4「现在...

人工智能 2024-01-02 人工智能

785阅读

ComfyUI实用插件Plush-for-ComfyUI 可在ComfyUI中调用GPT-4和DALL-E3

Plush-for-ComfyUI插件是一个非常有趣的工具，它可以在ComfyUI平台中调用GPT-4和DALL-E3，实现从图片提取提示词并使用DALL-E3在ComfyUI中生成图片。项目地址:https://top.aibase.com/tool...

人工智能 2024-01-02 人工智能

1137阅读

ChatGPT变笨新解释：世界被AI改变，与训练时不同了

对于ChatGPT变笨原因，学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出: 论文重点研究了“任务污染”问题，也就是大模型在训练时期就见识过很多任务示例，给人一种AI拥有零样本或少样本能力的错误印象。也有学者从另一个角度指出，大模型训练...

大数据 2024-01-01 人工智能

816阅读

AI绘画中采样器用于逐步去噪

介绍 Stable Diffusion 进行 AI 绘画，采样器存在的价值就是从噪声出发，逐步去噪，得到一张清晰的图像。 https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 以下是...

生成式AI 2023-12-31 人工智能

939阅读

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

如你我所见，大语言模型（LLM）正在改变深度学习的格局，在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能，但获取高质量人类数据却面临着重大瓶颈。这对于要解决复杂问题的任务...

人工智能 2023-12-26 人工智能

838阅读

文心一言4 测评

文章目录中文语句理解 “我一把把把把住了” “别别别的” 藏头诗文案策划组会汇报文档视频文案课程大纲设计 C++考点设计人工智能引论生活场景旅游计划代码生成与分析样例1：python多进程程序样例2：数据处理...

人工智能 2023-12-25 人工智能

1206阅读

【AIGC核心技术剖析】用于高效 3D 内容创建生成（从单视图图像生成高质量的纹理网格）

3D 内容创建的最新进展主要利用通过分数蒸馏抽样（SDS）生成的基于优化的 3D 生成。尽管已经显示出有希望的结果，但这些方法通常存在每个样本优化缓慢的问题，限制了它们的实际应用。在本文中，我们提出了DreamGaussian，这是一种新颖的3D内容生...

生成式AI 2023-12-23 人工智能

861阅读

Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言

1.摘要我们提出了一个多模态框架Video-LLaMA1，它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作，补充线性最小二乘法只处理视觉或听觉信号...

人工智能 2023-12-21 人工智能

1135阅读

摸底谷歌Gemini：CMU全面测评，Gemini Pro不敌GPT 3.5 Turbo

前段时间，谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra（能力最强）、Pro 和 Nano。研究团队公布的测试结果显示，Ultra 版本在许多任务中优于 GPT4，而 Pro 版本与 GPT-3...

人工智能 2023-12-20 人工智能

868阅读

CVPR 2023 | 可控文生图/定制化文生图领域论文详解 AI作画增强版

可控文生图/定制化文生图 1、DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation DreamBooth是一种新的文本到图像扩散模型...

人工智能 2023-12-20 人工智能

1002阅读

DALL·E2(unCLIP)、Stable Diffusion、IS、FID要点总结

DALL·E 1 DALL·E 1可以看成是VQ-VAE和文本经过BPE编码得到的embedding AE（Auto Encoder） encoder decoder结构，AE在生成任务时只会模仿不会创造，所有有了后面的VAE VAE(Var...

AIGC 2023-12-19 人工智能

1107阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始，多次去...

生成式AI 2023-12-18 人工智能

944阅读