生成模型第4页 - AIGC资讯

Pika、Stable Diffusion、Runway 三大AI生成视频工具PK

如果我们需要一个相对安全且稳定的视频AI生成工具,Pika可能是目前最佳的选择。如果我们想探索视频AI的未来潜力,那么Stable Diffusion无疑代表了最前沿的技术。Runway ML提供了丰富的视频效果相关模型,但在原生视频生成能力上略逊于前两者...

AIGC 2024-06-16 人工智能

1584阅读

AI视频新霸主诞生！Dream Machine官宣免费用，电影级大片全网玩疯

【新智元导读】继Pika宣布上新2.0版本后，视频生成领域又有新模型加入。成立于2021年的Luma AI今天刚刚官宣了文生视频/图生视频模型Dream Machine，而且提供免费使用API，高质量的生成效果获得了很多网友的好评。视频生成领域，又添一员...

大数据 2024-06-15 人工智能

903阅读

天才程序员周弈帆 | Stable Diffusion 解读（一）：回顾早期工作

本文来源公众号“天才程序员周弈帆”，仅用于学术分享，侵权删，干货满满。原文链接：Stable Diffusion 解读（一）：回顾早期工作在2022年的这波AI绘画浪潮中，Stable Diffusion无疑是最受欢迎的图像生成模型。究其原因，第一...

AIGC 2024-06-14 人工智能

1140阅读

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图

目前人工智能模型可以分为两大类别，包括判别模型 (Discriminative Model 与生成模型 (Generative Model 。判别模型根据一组输入数据，例如文本、X 射线图像或者游戏画面，经过一系列计算得到相应目标输出结果，例如单词翻译结...

生成式AI 2024-06-14 人工智能

960阅读

终于来啦！Stable Diffusion 3将在6月12日正式开源

6月3日晚，著名开源大模型平台Stability AI的联合首席执行官Christian Laforte，在AMD的产品发布会上宣布，文生图模型 Stable Diffusion 3将于6月12日在Hugging Face开源权重。本次开源的是Stab...

大数据 2024-06-13 人工智能

828阅读

超5万人排队内测！海内外爆火的“中国版Sora”惊艳全场，真这么好用？| AI评测

谁能想到，现在外网最抢手的AI视频生成模型，不是Sora，也不是Runway或Pika，而是国产大模型“Kling（可灵）”。可灵视频合集在X平台上获得数百万浏览量由于生成视频效果惊艳，可灵在国外获得了“中国版Sora”“Sora杀手”等称号。除了...

大数据 2024-06-13 人工智能

1628阅读

RAG 与长文本，此消彼长还是相辅相成？

上周，PingCAP AI Lab 数据科学家孙逸神的文章《当前都在堆长窗口，还需要 RAG 吗？》从用户的角度谈了长窗口&RAG 的看法，引起了众多同行的围观，本周我们采访了张粲宇，看看搞向量数据库的业内人士，是怎么看待这个问题的？...

人工智能 2024-06-12 人工智能

895阅读

diffusers flask streamlit或gradio 简洁可视化AIGC文生图页面

参考： https://python-bloggers.com/2022/12/stable-diffusion-application-with-streamlit/ https://github.com/LowinLi/stable-diffusion...

生成式AI 2024-06-12 人工智能

1066阅读

AIGC系列之：GroundingDNIO原理解读及在Stable Diffusion中使用

目录 1.前言 2.方法概括 3.算法介绍 3.1图像-文本特征提取与增强 3.2基于文本引导的目标检测 3.3跨模态解码器 3.4文本prompt特征提取 4.应用场景 4.1结合生成模型完成目标区域生成 4.2结合stable di...

大数据 2024-06-12 人工智能

2308阅读

AIGC降重：学姐教你如何免费检测并降低AIGC率

确保学术论文的独立性与诚信性，对于学业的成就及学位的获取至关重要，其中，论文的人工智能查重与降低AIGC相似度扮演着核心角色。常规的查重手段主要围绕查重软件的运用和个体的自行审查；而降重则通常通过语句重组、同义替换、内容丰富化以及精准引注等手段来提升文...

生成式AI 2024-06-11 人工智能

3221阅读

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图(1)

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的...

大数据 2024-06-11 人工智能

873阅读

stable diffusion比 transformer 作了哪些改进

Stable Diffusion 是一个基于自注意力机制的生成模型，它的设计受到了 Transformer 模型的启发，但也在很多方面进行了改进。以下是 Stable Diffusion 相较于 Transformer 的一些改进之处：稳定性提升：...

大数据 2024-06-10 人工智能

1049阅读

AIGC未来展望：AI将如何改变内容创作

AIGC未来展望：AI将如何改变内容创作 1.背景介绍 1.1 内容创作的重要性在当今时代,内容创作无疑已成为一项关键的生产力。无论是营销、教育、娱乐还是其他领域,高质量的内容都是吸引受众、传播信息、实现价值的关键。然而,创作优秀内容需要大量的时间...

大数据 2024-06-10 人工智能

930阅读

存内计算与扩散模型：下一代视觉AIGC能力提升的关键

目录前言视觉AIGC的ChatGPT4.0时代扩散模型的算力“饥渴症” 存内计算解救算力“饥渴症” 结语前言在这个AI技术日新月异的时代，我们正见证着前所未有的创新与变革。尤其是在视觉内容生成领域...

AIGC 2024-06-10 人工智能

823阅读

自然语言处理（NLP）技术在AIGC中的突破

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

生成式AI 2024-06-10 人工智能

1086阅读

快速入门大模型技术与应用，推荐你从Stable Diffusion开始学起

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注世界是变化的，分子是...

大数据 2024-06-09 人工智能

1046阅读

神经网络应用与实战案例详解（AIGC技术方向）

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参...

AIGC 2024-06-09 人工智能

942阅读

AI绘画的算法原理：从生成模型到Diffusion

近年来，AI绘画技术引起了广泛关注，让我们深入探讨其背后的技术原理和发展历程。本文将以通俗易懂的方式，介绍AI绘画的核心算法，从生成模型到Diffusion。 1. 计算机如何生成图画？ AI绘画的核心在于生成模型（ge...

AIGC 2024-06-07 人工智能

1636阅读

AI绘画Stable Diffusion神级插件！sd-forge-layerdiffuse

大家好，我是程序员晓晓今天给大家介绍一个插件，全名是 sd-forge-layerdiffuse。它的功能很简单，就是可以让 Stable Diffusion 生成带透明通道的PNG图片。比如一个水瓶。一只猫。二次元。简而言...

大数据 2024-06-07 人工智能

1505阅读

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

什么？疯狂动物城被国产AI搬进现实了？与视频一同曝光的，是一款名为「可灵」全新国产视频生成大模型。它采用了Sora相似的技术路线，结合多项自研技术创新，生成的视频不仅运动幅度大且合理，还能模拟物理世界特性，具备强大的概念组合能力和想象力。数据上看...

大数据 2024-06-06 人工智能

915阅读

AI日报：字节推王炸级语音生成模型Seed-TTS；Suno新功能被Udio抢跑；腾讯发布开源混元DiT加速库；即梦全量上线实时画布功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、字节推语音生成模型Seed-T...

人工智能 2024-06-06 人工智能

965阅读

如何在本地运行Stable Diffusion生成震撼图像

2022年AI的奇迹：如何在本地运行Stable Diffusion生成震撼图像 2022年是人工智能领域的奇迹之年。Stability.ai 开源的 Stable Diffusion 模型与 OpenAI 发布的 ChatGPT，像两颗耀眼的明星，点...

AIGC 2024-06-06 人工智能

936阅读

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

北航的研究团队，用扩散模型“复刻”了一个地球？在全球的任意位置，模型都能生成多种分辨率的遥感图像，创造出丰富多样的“平行场景”。而且地形、气候、植被等复杂的地理特征，也全都考虑到了。受Google Earth启发，北航的研究团队从俯拍视角出发，将...

生成式AI 2024-06-05 人工智能

776阅读

人工智能 | 360自研可控布局AI绘画模型HiCo发布

龙年春意伊始，360人工智能研究院正式发布新的AI绘画模型：可控布局生成模型HiCo。与大家所熟悉的文生图模型相比，HiCo在普通的文本输入之上，提供了更为强大的画面布局控制能力：用户可以根据自己的构思，指定在画面不同的区域生成不同的指定内容，实现A...

AIGC 2024-06-05 人工智能

870阅读

扩散模型的技术原理和应用价值

引言一、扩散模型的基本概念扩散模型(Diffusion Models 是一种基于概率论的生成模型，最初源自物理学中的扩散过程理论，比如墨水在水中的扩散过程。在机器学习领域，这一概念被创造性地应用于数据生成任务，特别是图像和声音的合成。它们通过模拟一个...

AIGC 2024-06-05 人工智能

1333阅读

生数科技完成数亿元 Pre-A 轮融资加速布局多模态大模型

生数科技完成数亿元 Pre-A 轮融资，该轮融资由北京市人工智能产业投资基金、百度联合领投，中关村科学城公司等跟投，启明创投等数位老股东继续支持。此前，生数科技已经获得来自蚂蚁集团、BV百度风投、卓源亚洲、锦秋基金、达泰资本、智谱AI等机构的投资。本轮融...

人工智能 2024-06-05 人工智能

793阅读

【保姆级教程】Linux上部署Stable Diffusion WebUI和LoRA训练，拥有你的专属图片生成模型

0 写在前面 Stable Diffusion 是当前最火热的图像生成模型之一，目前已经广泛应用于艺术创作、游戏开发、设计模拟等领域，因其开源生态和易于使用而受到创作者的广泛关注，相比 Midjourney 而言，其最大的优势是完全免费，且拥有庞大的社...

人工智能 2024-06-05 人工智能

1244阅读

AI训练数据的版权保护：公地的悲剧还是合作的繁荣?

GPT-4o内置声音模仿「寡姐」一案闹的沸沸扬扬，虽然以OpenAI发布声明暂停使用疑似寡姐声音的「SKY」的语音、否认曾侵权声音为阶段性结束。但是，一时间「即便是AI，也得保护人类版权」这一话题甚嚣尘上，更刺激起了人们本来就对AI是否可控这一现代迷思的...

大数据 2024-06-04 人工智能

949阅读

文心一言指令详解及实例分析

一、引言文心一言，作为人工智能领域的杰出代表，以其独特的自然语言处理能力和广泛的应用场景，受到了广泛的关注。文心一言指令，作为其核心功能之一，允许用户通过自然语言与文心一言进行交互，实现信息的查询、生成、理解和推理。本文将详细介绍文心一言指...

生成式AI 2024-06-04 人工智能

1284阅读

实时局部建图的深入思考 | MapTR继往开来的18篇论文剖析！

本文经自动驾驶之心公众号授权转载，转载请联系出处。实时局部建图领域自从端到端方案MapTR(2023.1 [1]问世后已经又涌现出非常多优秀的工作,基本是在MapTR基本框架的基础上进行一系列改进,包括原班人马的升级作品MapTRv2(2023.8 ...

人工智能 2024-06-04 人工智能

1641阅读

深度解析：人工智能作画算法的原理与技术

引言在数字艺术的探索中，人工智能（AI）作画算法以其独特的创造性和艺术性引起了广泛的兴趣。这些算法不仅仅是简单的图像处理工具，它们背后蕴藏着复杂的神经网络和深度学习模型。本文将深入探讨AI作画算法的原理与技术，揭示其背后的复杂性和魅力。 1. 数据...

AIGC 2024-06-04 人工智能

1458阅读

AI日报：SD 3宣布开源；中文语音AI天花板ChatTTS官网上线；Veo支持单图生成视频；ElevenLabs推多样化AI音频模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、抖音：将打击使用AI技术P图侮...

人工智能 2024-06-03 人工智能

945阅读

AI绘画究竟在哪些方面降低了门槛

AI绘画的产物是图像。图像对人类的认知、情感和文化发展起着重要的作用，包括信息传递、创造性表达、历史记录、审美享受和交流。从原来的纸笔调色板到数字时代的数字板、绘图软件，再到AI绘画时代，任何人都可以用几行简单的文字创作出高质量的艺术作品。人类创作的门...

人工智能 2024-06-03 人工智能

849阅读

AIGC视频生成-CameraCtrl

0. 资源链接论文: CameraCtrl: Enabling Camera Control for Text-to-Video Generation 项目: https://hehao13.github.io/projects-CameraC...

生成式AI 2024-06-02 人工智能

1127阅读

Stable Diffusion的微调方法详解

Stable Diffusion作为一种强大的文本到图像生成模型，已经在艺术、设计和科研等多个领域取得了广泛的应用。然而，为了使其更好地适应特定任务或领域，微调（Fine-tuning）技术显得尤为重要。本文将详细介绍Stable Diffusion的微调...

生成式AI 2024-06-01 人工智能

975阅读

AI日报：GPTs免费向所有人开放；AI神器腾讯元宝APP上线；新SD加速模型PCM来了；Udio可生成两分钟音频了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、GPTs向所有免费ChatGP...

生成式AI 2024-05-30 人工智能

1152阅读

Stable Diffusion文生图技术详解：从零基础到掌握CLIP模型、Unet训练和采样器迭代

文章目录概要 Stable Diffusion 底层结构与原理文本编码器（Text Encoder）图片生成器（Image Generator）那扩散过程发生了什么？ stable diffusion 总体架构主要模块分析 Un...

人工智能 2024-05-30 人工智能

1521阅读

文生图——python调用stable diffusionAPI生成有趣的图像

本文将介绍如何使用Python调用Stable Diffusion API进行图像生成，实现文生图的功能。通过详细的步骤说明和示例代码，读者将能够轻松掌握这一技术，并运用它生成独特而富有创意的图像作品。无论你是编程爱好者还是设计师，都能从中获得启发和乐趣。...

生成式AI 2024-05-30 人工智能

1538阅读

如何将大型语言模型（LLM）转换为嵌入模型

译者 | 李睿审校 | 重楼实验证明，LLM2Vec模型在嵌入任务上具有更好的性能，它可以为组织开辟新的场所，并以非常低的成本快速创建专门的嵌入模型。嵌入模型已经成为大型语言模型(LLM 应用的重要组成部分，可以实现检测文本相似度、信息检索和聚类...

大数据 2024-05-30 人工智能

898阅读

AI新时代——【深度学习】驱动的【AIGC大模型】与【机器学习】的创新融合

目录 1.机器学习与人工智能的基础 1.机器学习的基本原理 2.人工智能的广泛应用 2.深度学习的崛起 1.深度学习的概念和原理 2.卷积神经网络（CNN） 3.循环神经网络（RNN） 3.AIGC大模型的创新 1.AIGC的概念和应用...

AIGC 2024-05-30 人工智能

970阅读

【stable diffusion】在AutoDL算力云平台部署stable diffusion

文章中提到的网址连接 AutoDL的网址连接：https://www.autodl.com/Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像，尽管它也可以应用于其他任务，如内补绘制、外补绘制...

AIGC 2024-05-30 人工智能

1408阅读

当前都在堆长窗口，还需要 RAG 吗？

自从谷歌的 Gemini 1.5 Pro 发布后，行业内就有不少人在背后“蛐蛐” RAG。一方面是因为，Gemini 的表现确实亮眼。根据官方发布的技术报告，Gemini 1.5 Pro 能够稳定处理高达100 token，相当于1小时的视频、11小时...

人工智能 2024-05-29 人工智能

1081阅读

现在适合进入AIGC行业吗？

现在适合进入AIGC行业吗？随着人工智能生成内容（AIGC）技术的快速发展，越来越多的人开始关注这个行业。那么，现在是否是进入AIGC行业的好时机呢？本文将从行业前景、市场需求以及个人选择与规划三个方向进行探讨。行业前景发展前景 AI...

生成式AI 2024-05-29 人工智能

825阅读

图像生成模型浅析（Stable Diffusion、DALL-E、Imagen）

目录前言 1. 速览图像生成模型 1.1 VAE 1.2 Flow-based Model 1.3 Diffusion Model 1.4 GAN 1.5 对比速览 2. Diffusion Model 3. Stable Diffusi...

AIGC 2024-05-28 人工智能

908阅读

AI日报：百度发布文心大模型学习机；Open-Sora 1.1可生成21秒视频；Canva可以自动剪辑视频了；超牛ComfyUI节点AnyNode来了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、百度文心大模型学习机“小度学习...

大数据 2024-05-28 人工智能

917阅读

多模态预训练模型在 OPPO 端云场景的落地实践

一、端侧图文检索技术研究 1. 解决了什么问题？首先来介绍图文检索技术。以前在手机端相册搜索照片，都是基于标签来搜索。从 CLIP 模型出现后开始做自然语言搜索。目前正在解决端侧性能、搜索效果、安全等问题。技术难度并不大，重点在于提高搜索速度。并...

生成式AI 2024-05-27 人工智能

940阅读

免费AI出图神器：StableStudio——定义AI作画新前景

StableStudio：探索艺术与科技的无限交界，StableStudio引领AI智能创作新浪潮！ - 精选真开源，释放新价值。概览 ChatGPT大语言模型AI的诞生引爆了对AIGC的讨论。AIGC 又称生成式 AI (Generat...

AIGC 2024-05-27 人工智能

785阅读

LLaMA-Factory微调LLama2

LLaMA-Factory(0.6.2版本微调LLama2 1.下载安装 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e...

生成式AI 2024-05-27 人工智能

1045阅读

离大模型落地应用最近的工程化技术(RAG)

虽然大规模语言模型（LLM）在自然语言处理（NLP）方面表现出了其强大的文本生成和理解能力，但是它们在实际应用中仍然面临一些挑战，如处理大规模知识库和实时获取最新信息的能力，并且会产生幻觉。为了解决这些问题，检索增强生成（Retrieval-Augmen...

大数据 2024-05-27 人工智能

847阅读

DiffMap：首个利用LDM来增强高精地图构建的网络

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文标题： DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者： Peijin Jia, Tuo...

大数据 2024-05-27 人工智能

939阅读