图像模型第2页 - AIGC资讯

AI视频年大爆发！Gen-2/Pika成时代爆款，2023年AI视频生成领域的现状全盘点

【新智元导读】2023年，也是AI视频元年。过去一年究竟有哪些爆款应用诞生，未来视频生成领域面临的难题还有哪些? 过去一年，AI视频领域我们见证了，Gen-2、Pika等爆款产品的诞生。来自a16z的Justine Moore，详细盘点了人工智能视频生成...

大数据 2024-02-11 人工智能

934阅读

AIGC从入门到精通

目录 1. 概述 2. 一键起飞 2.1 webui 2.2 基础用法 2.3 必装插件 2.4 Fooocus 2.5 diffusers 3 LoRA 3.1 原理 3.2 训练流程和准备 3.3 上手训练...

大数据 2024-02-11 人工智能

1289阅读

通过日月摘星全面使用Midjourney

在这个信息爆炸的时代，我们每天都被无数的图文信息包围。如何在这海量的信息中脱颖而出，成为了每个品牌和个人的挑战。今天，我要为大家介绍的，是通过“日月摘星”快速便捷的使用Midjourney，让您的战斗力可以至少翻一倍！ Midjourney是一款强大的图...

人工智能 2024-02-11 人工智能

827阅读

玩LLM和StableDiffusion常说的LoRA到底是什么

论文地址：LoRA: Low-Rank Adaptation of Large Language Models LoRA是一种用于adapters和大模型迁移的技术,全称为Low-Rank Adaptation of Large Language M...

生成式AI 2024-02-07 人工智能

1546阅读

GPT4、文心一言4、ChatGLM、Claude2.1四大语言模型生成效果对比

随着AIGC大风起，也掀起了语言模型大争之世，各种语言模型如雨后春笋，让大家眼花缭乱。周周都有新的选手入场，月月都有新的模型问世。不过其中最受人瞩目的当属GPT4、文心一言4、ChatGLM、Claude2.1四大模型。隐隐有傲视群雄之姿，...

大数据 2024-02-06 人工智能

1445阅读

【CV】稳定扩散模型（Stable Diffusion）

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自...

人工智能 2024-02-03 人工智能

1009阅读

小红书开源「InstantID」效果炸裂，被Yann LeCun点赞，迅速蹿上Github热榜

最近，有一群来自小红书的 95 后神秘团队，自称 InstantX，搞了个大动作 —— 开源「InstantID」项目。 InstantID 凭借着高质量的图像生成能力，在开源界掀起了一股热潮：不仅获得了众多技术大佬的点赞，更是在 GitHub 热榜上迅...

人工智能 2024-02-01 人工智能

933阅读

一文了解国外AIGC头部产品

AIGC是指通过人工智能技术生成的内容，包括文字、图片、音频和视频等。AIGC技术可以基于大量的数据和算法，自动地生成各种类型的内容，可以用于新闻报道、广告宣传、文学创作、游戏设计等各个领域。AIGC技术的优点在于可以大大提高内容生产的效率和质量，节省了人...

大数据 2024-01-30 人工智能

945阅读

【AIGC-文本/图片生成视频系列-9】MagicVideo-V2: 多阶段高美感视频生成

目录一. 项目概述与贡献二. 方法详解编辑三. 文本生成视频相关结果四. 与其他方法对比结果五. 个人感悟最近得益于扩散模型的快速发展，文本到视频（T2V）模型的激增。今天要介绍的是字节的MagicVideo-V2，一个新颖...

生成式AI 2024-01-30 人工智能

1223阅读

过去两周，六个最有可能改变AI进程的发布！

编译｜言征过去两周，新的人工智能更新不断涌现，异常疯狂。我们决定整理最近发布的六大框架和模型。 1、ActAnywhere：主题感知视频背景生成图片 Adobe Research和斯坦福大学推出了Act Anywhere，这是一种生成模型，解决了电...

人工智能 2024-01-29 人工智能

853阅读

Apple：使用语言模型的自回归方式进行图像模型预训练

1、背景在GPT等大模型出现后，语言模型这种Transformer+自回归建模的方式，也就是预测next token的预训练任务，取得了非常大的成功。那么，这种自回归建模方式能不能在视觉模型上取得比较好的效果呢？今天介绍的这篇文章，就是Apple近期发...

生成式AI 2024-01-29 人工智能

865阅读

ChatGPT重磅升级！集简云支持GPT4 Turbo Vision, GPT4 Turbo, Dall.E 3,Whisper等最新模型

在11月7日凌晨，OpenAI全球开发者大会宣布了 GPT-4的一次大升级，推出了 GPT-4 Turbo号称为迄今为止最强的大模型。此次GPT-4的更新和升级在多个方面显示出强大的优势和潜力。为了让集简云用户能快速体验新模型的能力，我们第一时间整理了大...

大数据 2024-01-26 人工智能

1149阅读

整理一下最近了解到的AIGC工具

AIGC工具的一点整理前言 AIGC类型图像生成类 Stable diffusion Midjourney DALL·E 2 三种工具比较 DeepFloyd IF 文本生成语音生成 So-vits-svc 4.0 结尾...

人工智能 2024-01-26 人工智能

1633阅读

CharacterGLM体验入口语言AI技术平台免费试用方法

CharacterGLM是智谱AI开放平台专注语言AI技术产业化落地的尖端工具。通过开放大模型芯片、语言模型API和各行业应用工具，让AI大模型的能力普惠于千行百业，帮助企业和开发者快速连接AI的力量，实现AI的产业化赋能，将AI技术的好处带给每个人。...

人工智能 2024-01-24 人工智能

932阅读

stable diffusion模型评价框架

GhostReview:全球第一套AI绘画ckpt评测框架代码 - 知乎大家好，我是_GhostInShell_，是全球AI绘画模型网站Civitai的All Time Highest Rated (全球历史最高评价第二名的GhostMix的作者。在上...

AIGC 2024-01-24 人工智能

1587阅读

AI作画的背后是怎么一步步实现的？一文详解AI作画算法原理+性能评测

前言 “AI作画依赖于多模态预训练，实际上各类作画AI模型早已存在，之所以近期作品质量提升很多，可能是因为以前预训练没有受到重视，还达不到媲美人类的程度，但随着数据量、训练量的增多，最终达到了现在呈现的效果。”远在AI作画还没有爆火之前，深度学习就已经...

生成式AI 2024-01-24 人工智能

1127阅读

2024 年值得关注的 6 大生成式 AI 趋势

2023年是人工智能领域长期以来最具颠覆性的一年，大量生成式人工智能产品进入主流。继续其变革之旅，生成式人工智能有望在2024年从兴奋的话题转变为现实世界的应用。随着科技公司不断开发和微调人工智能模型，生成式人工智能领域正在迅速发展，催生了一系列广泛的趋...

AIGC 2024-01-23 人工智能

1093阅读

stable-diffusion、stable-diffusion-webui、novelai、naifu区别介绍

文章目录 1. Stable Diffusion Reference 2. Stable Diffusion WebUI Reference 3. NovelAI Reference 4. Naifu Reference 区别简述 Refere...

大数据 2024-01-23 人工智能

1439阅读

【AIGC】AnimateDiff:无需定制化微调的动画化个性化的文生图模型

前言 Animatediff是一个有效的框架将文本到图像模型扩展到动画生成器中，无需针对特定模型进行调整。只要在大型视频数据集中学习到运动先验知识。AnimateDiff就可以插入到个性化的文生图模型中，与Civitai和Huggingface的文生图...

AIGC 2024-01-23 人工智能

1432阅读

Midjourney V6刷屏，但它最可怕的地方居然不是那些神图？

Midjourney在沉寂九个月后推出了Midjourney V6，这个文生图产品体现出的更细腻的细节处理，更强大的语言理解能力和更加“不像AI”的图片效果在过去几天引发一片惊呼。作为一个闭源的模型产品，Midjourney的魔法配方并不为人所知，但就...

AIGC 2024-01-23 人工智能

883阅读

爆肝整理全网最全最新AI生成算法【Stable Diffusion｜Diffusion Model｜DallE2｜CLIP｜VAE｜VQGAN】原理解析

1、生成模型首先回顾一下生成模型要解决的问题：如上图所示，给定两组数据z和x，其中z服从已知的简单先验分布π(z （通常是高斯分布），x服从复杂的分布p(x （即训练数据代表的分布），现在我们想要找到一个变换函数f，它能建立一种z到x的映射f:z...

生成式AI 2024-01-23 人工智能

1505阅读

MagicVideo-V2体验入口字节AI视频生成工具使用方法下载链接

MagicVideo-V2 是一款卓越的AI视频生成工具，它集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块，构建了一个端到端视频生成管道。如果您想了解如何使用MagicVideo-V2 以及它的出色特点，请继续阅读。 MagicVid...

AIGC 2024-01-22 人工智能

1864阅读

AIGC文生图及工具产品简介

AIGC，全称是人工智能生成内容（Artificial Intelligence Generated Content）是继UGC（用户生成内容），PGC（平台生成内容）后，利用人工智能技术，自动生成内容的生产方式；目前主要利用&集成自然语言处理、...

大数据 2024-01-22 人工智能

1364阅读

AIGC内容分享(二十)：「AI视频生成」技术核心基础知识和模型应用

目录何为AI视频？一、技术发展概况二、代表模型及应用三、仍存在许多技术难点何为AI视频？「AI视频」通常指的是由人工智能（AI）技术生成或处理的视频。这可能包括使用深度学习、计算机视觉和其他相关技术来改善视频的质...

人工智能 2024-01-22 人工智能

2784阅读

AIGC中的视觉生成文献整理

文章目录文件夹文献总览图像生成技术视频生成技术 Video Generation with Text Condition Video Generation with other Conditions Video Editing 生成模...

大数据 2024-01-21 人工智能

1215阅读

AIGC原理：扩散模型diffusion综述一：面向视觉计算的扩散模型研究进展

论文地址：State of the Art on Diffusion Models for Visual Computing ? 贴一幅SGM（Score-based Generative Model）的原因是宋飏博士将他2019年提出的SMLD模型和20...

AIGC 2024-01-20 人工智能

1937阅读

AIGC 3D即将爆发，混合显示成为产业数字化的生产力平台

2023年，大语言模型与生成式AI浪潮席卷全球，以文字和2D图像生成为代表的AIGC正在全面刷新产业数字化。而容易为市场所忽略的是，3D图像生成正在成为下一个AIGC风口，AIGC 3D宇宙即将爆发。所谓AIGC 3D宇宙，即由文本生成3D图像或由2D图像...

AIGC 2024-01-20 人工智能

876阅读

20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

不得不说，现在拍写真真是“简单到放肆”了。真人不用出镜，不用费心凹姿势、搞发型，只需一张本人图像，等待几秒钟，就能获得7种完全不同风格: 仔细看，造型/pose全都给你整得明明白白，并且原图直出修也不用修了。这搁以前，不得在写真馆耗上至少整整一天，把...

生成式AI 2024-01-19 人工智能

837阅读

AIGC系列之：ControlNet原理及论文解读

《Adding Conditional Control to Text-to-Image Diffusion Models》目录 1.背景介绍 2.原理详解 2.1 Controlnet 2.2 用于Stable Diffusion的Contr...

人工智能 2024-01-18 人工智能

1474阅读

苹果AIM自回归视觉模型验证性能与模型规模有关

苹果公司的研究者通过自回归图像模型（AIM）验证了视觉模型“参数越多性能越强”的规律，进一步证明随着容量或预训练数据量的增加，模型能不断提升性能。AIM能有效利用大量未经整理的图像数据，训练方法和稳定性与最近的大型语言模型(LLM 类似。这一观察结果与之前...

人工智能 2024-01-18 人工智能

848阅读

20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

不得不说，现在拍写真真是“简单到放肆”了。真人不用出镜，不用费心凹姿势、搞发型，只需一张本人图像，等待几秒钟，就能获得7种完全不同风格：仔细看，造型/pose全都给你整得明明白白，并且原图直出修也不用修了。这搁以前，不得在写真馆耗上至少整整一天，...

生成式AI 2024-01-18 人工智能

862阅读

昆仑天工SkyWork：更懂中文的AIGC开源模型

昆仑天工SkyWork系列AIGC开源模型，由奇点智源公司研发，在2022年12月发布，覆盖图像、文本、编程等多模态内容生成能力，包括绘画、文章续写、对话、中英翻译、推理、诗词对联、菜谱撰写、合同起草、代码补全等。昆仑天工SkyWork系列模型...

人工智能 2024-01-18 人工智能

1407阅读

【AIGC】IP-Adapter：文本兼容图像提示适配器，用于文本到图像扩散模型

前言 IPAdapter能够通过图像给Stable Diffusion模型以内容提示，让其生成参考该图像画风，可以免去Lora的训练，达到参考画风人物的生成效果。摘要通过文本提示词生成的图像，往往需要设置复杂的提示...

生成式AI 2024-01-17 人工智能

1580阅读

MagicVideo-V2好不好用 AI视频生成软件推荐

MagicVideo-V2是一种文本到视频生成软件。它能够根据用户输入的文本描述，生成高质量、逼真的视频。MagicVideo-V2的体验下载入口在哪呢，这里我们来看下MagicVideo-V2的官方体验入口。 >>>点击前往 Magi...

AIGC 2024-01-16 人工智能

1290阅读

AIGC｜一文梳理「AI视频生成」技术核心基础知识和模型应用

大家好，我是猫先生，AI技术爱好者与深耕者！！ 2022年是AIGC（生成式AI）元年！从这一年开始，可谓是百家争鸣，各种技术层出不穷，再次迸发出AI的活力。从DALL·E 2、Stable Diffusion、Midjourney等文生图应用点燃了大众...

人工智能 2024-01-16 人工智能

2144阅读

Stable Diffusion-生式AI的新范式

! 扩散模型（Stable Diffusion 现在是生成图像的首选模型。由于扩散模型允许我们以提示( prompts 为条件生成图像，我们可以生成我们所选择的图像。在这些文本条件的扩散模型中，稳定扩散模型由于其开源性而最为著名。在这篇文章中，我们将...

人工智能 2024-01-14 人工智能

921阅读

Stable Diffusion 母公司开源大语言模型，代号「StableLM」！

公众号关注 “GitHubDaily” 设为 “星标”，每天带你逛 GitHub！昨天晚上 11 点，Stable Diffusion 的母公司 Stability AI 重磅宣布，正式开源一款全新的大语言模型：StableLM。...

人工智能 2024-01-14 人工智能

823阅读

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

一句话，就让绿巨人戴上VR眼镜。 4K画质那种。熊猫的奇幻漂流~ 这是字节最新的AI视频生成模型MagicVideo-V2，各种奇思妙想的想法都能实现。它不仅支持4K、8K超高分辨率，轻松hold各种绘图风格。 △从左往右：油画风、赛博风、设计风...

大数据 2024-01-14 人工智能

780阅读

谷歌MIT最新研究证明：高质量数据获取不难，大模型就是归途

获取高质量数据，已经成为当前大模型训练的一大瓶颈。前几天，OpenAI被《纽约时报》起诉，并要求索赔数十亿美元。诉状中，列举了GPT-4抄袭的多项罪证。甚至，《纽约时报》还呼吁摧毁几乎所有的GPT等大模型。一直以来，AI界多位大佬认为「合成数据」...

人工智能 2024-01-13 人工智能

819阅读

为什么人工智能如此需要资源？

截至2023年底，任何关于生成式人工智能需要多少能源的预测都是不准确的。头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万个家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，功率密度将上升到每机架50千瓦或100千...

人工智能 2024-01-13 人工智能

823阅读

Textual Inversion: 一种精调Stable Diffusion模型的方法

引言最近的文本到图像Stable Diffusion （SD）模型已经证明了使用文本提示合成新颖场景的前所未有的能力。这些文本到图像的模型提供了通过自然语言指导创作的自由。然而，它们的使用受到用户描述特定或独特场景、艺术创作或新物理产品的能力的限制。...

生成式AI 2024-01-09 人工智能

1054阅读

aAMUSEd官网体验入口 AI自然语言处理工具软件免费下载地址

aAMUSEd是一个开源平台，提供各种自然语言处理（NLP）模型、数据集和工具。它包含一个基于MUSE的轻量级遮蔽图像模型（MIM），专用于文本到图像的生成。与潜在扩散（latent diffusion）方法相比，MIM需要更少的推理步骤，且更易于解释。此...

AIGC 2024-01-05 人工智能

820阅读

【AIGC-图片生成视频系列-4】DreamTuner：单张图像足以进行主题驱动生成

目录一. 项目概述问题：解决：二. 方法详解 a 整体结构 b 自主题注意力三. 文本控制的动漫角色驱动图像生成的结果四. 文本控制的自然图像驱动图像生成的结果五. 姿势控制角色驱动图像生成的结果 2023年的最后一...

大数据 2024-01-04 人工智能

876阅读

[AI绘画] 即插即用！SDXL+T2I-Adapters 高效可控的生成图片

标题：T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文：https://arxiv....

人工智能 2024-01-03 人工智能

1095阅读

精选了6款好用的AI绘画工具，值得一试

近几年来，伴随着AI技术的发展，设计领域发生了巨大的变化。AI绘图工具的出现很大程度上减轻了设计师的工作负担，本文精选了6款优秀的AI绘图工具为大家推荐，一起来看看吧！ 1、即时灵感即时灵感作为国产的AI绘图工具，使用起来相对来说更加方便。它采用先进...

大数据 2024-01-03 人工智能

3282阅读

ChatGPT付费版来啦，好用的AI生成产品还能免费使用吗？AIGC工具箱

最新消息，chatGPT推出了付费版！每月＄42美元，不限流使用，你会付费使用吗？ ?AIGC工具箱下面推荐几款AI 生成产品！你觉得哪个更好用呢？ AI 的出现，颠覆了内容生产的方式，在有的人还在从 0 开始学习作图软件...

人工智能 2024-01-02 人工智能

1214阅读

kaggle竞赛-Stable Diffusion数据分析与baseline

你的目的是来预测我们生成图像的提示词 1.比赛目标这个竞赛的目标不是从文本提示生成图像，而是创建一个模型，可以在给定生成图像的情况下预测文本提示（你有一堆提示词，你预测是否该提示词参与了图像的生成）?您将在包含由Stable Diffusion 2....

AIGC 2023-12-30 人工智能

815阅读

AIGC系列文章目录第三章 AIGC 简单易用免费的AI图像生成器: Stable Diffusion

AIGC系列文章目录第三章 AIGC 简单易用免费的AI图像生成器: Stable Diffusion 文章目录 AIGC系列文章目录第三章 AIGC 简单易用免费的AI图像生成器: Stable Diffusion 一、S...

人工智能 2023-12-26 人工智能

920阅读

在 Apple Silicon Mac 上部署 StableDiffusion 的分步指南，释放 Apple Silicon 芯片及其神经引擎的全部潜力

任何使用AI模型生成图像的服务都在涌现。这些服务中的大多数都提供基于积分的定价系统，您可以在其中购买积分以用于服务，并且每项服务都有自己的每张图片积分等级。另一种选择是直接在您自己的机器上部署文本到图像模型，这样可以避免任何使用成本，除了操作机器的成本。事...

生成式AI 2023-12-26 人工智能

865阅读

AI绘画：SDXL1.0正式版+2款软件+多种在线体验方式！

万众期待的最强开源AI模型SDXL1.0终于开源了！ SDXL1.0 是什么？简单来说，它是目前最强大的开源AI绘画模型，开源当然也意味着免费。单纯从模型的角度来看，肯定比SD1.5，SD2.x这种强很多。如果你要寻找...

AIGC 2023-12-26 人工智能

1714阅读