高分辨率第4页 - AIGC资讯

揭秘AI幻觉：GPT-4V存在视觉编码漏洞，清华联合NUS提出LLaVA-UHD

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力，成为如今最领先...

大数据 2024-04-07 人工智能

853阅读

AI绘画24年最新的Stable Diffusion整合包安装教程，建议收藏！

1、背景信息 ▍Stable Diffusion 是什么？ Stable Diffusion（简称SD）是一种生成式人工智能，于2022年发布，主要用于根据文本描述生成详细图像，也可用于其他任务，如图像的修补、扩展和通过文本提示指导图像到图像的...

大数据 2024-04-07 人工智能

1272阅读

文生图大模型三部曲：DDPM、LDM、SD 详细讲解！

1、引言跨模态大模型是指能够在不同感官模态(如视觉、语言、音频等之间进行信息转换的大规模语言模型。当前图文跨模态大模型主要有：文生图大模型：如 Stable Diffusion系列、DALL-E系列、Imagen等图文匹配大模型：如CLI...

生成式AI 2024-04-05 人工智能

2545阅读

AI绘画 | 如何利用SD垫图实现照片风格转换

“ 小红书上有很多用AI做卡通头像的，大概思路是你拍一张个人照片发给博主，博主利用midjourney的垫图功能转换成卡通形象，一张收取一定费用……” 看过之前文章的人都应该知道，midjourney是付费的软件，而且需要一定魔法上网能力。今天给大家...

人工智能 2024-04-02 人工智能

1357阅读

秋叶大佬24年最新的Stable Diffusion整合包V4.6.7来了～

！「无套路！文末提供下载方式」要说今年绘画圈最大的新秀那妥妥的就Stable Diffution V4升级版无需安装**，直接解压就能用（在此要感谢秋葉aaaki大佬的分享！）比之前推送的更加智能、快速和简单有多简单呢？这么说...

AIGC 2024-04-02 人工智能

2229阅读

阿里7B多模态文档理解大模型拿下新SOTA

多模态文档理解能力新SOTA！阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5，针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战，提出了一系列解决方案。话不多说，先来看效果。复杂结构的图表一键识别转换为M...

生成式AI 2024-04-02 人工智能

962阅读

Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型

近期，中国香港中文大学和 SmartMore 的研究人员推出了一种名为 Mini-Gemini 的新颖框架，通过增强多模态输入处理来推动 VLMs 的发展。Mini-Gemini 采用了双编码器系统和一种新颖的补丁信息挖掘技术，结合一个特别策划的高质量数据...

大数据 2024-04-01 人工智能

833阅读

stable diffusion学习笔记——高清修复

ai画图中通常存在以下痛点：受限于本地设备的性能（主要是显卡显存），无法跑出分辨率较高的图片。生图的时候分辨率一调大就爆显存。即便显存足够。目前主流的模型大多基于SD1.0和SD1.5，这些模型在训练的时候通常使用小分辨率图片训练，在生成高分辨率图...

AIGC 2024-04-01 人工智能

1668阅读

恐怖谷！哥大华人开发「人脸机器人」，照镜子自主模仿人类表情超逼真

此前，人形机器人Ameca「大梦初醒」的神情，已让许多人感受到了真正的「恐惧」。随着ChatGPT横空出世，得到加持的人形机器人虽擅长语言交流，但是在非语言交流，特别是面部表情，还差得很远。未来，如果人类真的要生活在一个充满机器人的世界之中，机器...

AIGC 2024-04-01 人工智能

916阅读

Stable Diffusion WebUI 生成参数：高清修复/高分辨率修复（Hires.fix）

本文收录于《AI绘画从入门到精通》专栏，专栏总目录：点这里。大家好，我是水滴~~ 在本篇文章中，我们将深入探讨 Stable Diffusion WebUI 的一个引人注目的生成参数——高分辨率修复（Hires.fix）。我们将逐一解析这一功能的...

生成式AI 2024-03-30 人工智能

1240阅读

微软亚研院新作：让大模型一口气调用数百万个API！

近年来，人工智能发展迅速，尤其是像ChatGPT这样的基础大模型，在对话、上下文理解和代码生成等方面表现出色，能够为多种任务提供解决方案。但在特定领域任务上，由于专业数据的缺乏和可能的计算错误，它们的表现并不理想。同时，虽然已有一些专门针对特定任务的AI...

人工智能 2024-03-28 人工智能

919阅读

两分钟1200帧的长视频生成器StreamingT2V来了，代码将开源

广阔的战场，风暴兵在奔跑…… prompt：Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个文生视频（text-to-video）模型，尽管 AI 生成...

生成式AI 2024-03-27 人工智能

820阅读

DifFlow3D：场景流估计新SOTA，扩散模型又下一城！

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：DifFlow3D: Toward Robust Uncertainty-Aware Scene Flow Estimation with Iterative Diffusion-Based...

大数据 2024-03-27 人工智能

869阅读

CNN、Transformer、Uniformer之外，我们终于有了更高效的视频理解技术

视频理解的核心目标在于对时空表示的把握，这存在两个巨大挑战：短视频片段存在大量时空冗余和复杂的时空依赖关系。尽管曾经占主导地位的三维卷积神经网络 (CNN 和视频 Transformer 通过利用局部卷积或长距离注意力有效地应对其中之一的挑战，但它们在...

大数据 2024-03-26 人工智能

890阅读

stable diffusion webui升级bug问题解决思路(纯干货）

个人网站：https://tianfeng.space/ 文章目录一、前言二、个人方案 1.扼杀在萌芽中 A.解压后点击启动器运行依赖，然后点击A启动器 B.更新本体和扩展（全部到最新版本） C.把controlnet1.1放入sta...

人工智能 2024-03-24 人工智能

1853阅读

秋神SD整合包 AI绘画 Stable Diffusion 整合包 V4版解压即用 AI绘图模型LoRA + 最新

「无套路！文末提供下载方式」 2024年绘画圈最火的软件那妥妥的就Stable Diffution V4升级版无需安装，直接解压就能用（在此要感谢秋葉aaaki大佬的分享！）** 比之前版本的更加智能、高效和易操作 V4加强版小白也能轻...

大数据 2024-03-24 人工智能

1160阅读

Stable Diffusion AI绘画商业应用教程

BIGD Stable Diffusion商业化，AI绘画入门到精通，主要分为创意内容运营设计、品牌策划与视觉传达、三维视觉视效、电商活动节日宣传等。 Stable Diffusion 是⼀种基于扩散过程的图像生成模型，可以生成高质量、高分辨...

大数据 2024-03-23 人工智能

1325阅读

深圳3公里精准预报！华为发布首个区域天气预报AI模型“智霁”1.0

快科技3月23日消息，在今天世界气象日的气候行动最前线”主题活动上，华为云与深圳市气象局共同发布了首个人工智能区域预报模型智霁”1.0，标志着气象预报迎来了新的里程碑。这一区域模型以华为云盘古气象大模型为基础，融合了区域高质量气象数据集，能够迅速地为未来...

人工智能 2024-03-23 人工智能

825阅读

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

微软版Sora诞生了！ Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出了Diffusion Transformer和空间patch策略，但想要达到Sora的性能还是很难，何况还缺乏算力和数据集...

大数据 2024-03-22 人工智能

912阅读

Stable Diffusion 3 震撼发布，采用Sora同源技术，文字终于不乱码了

Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。继 OpenAI 的 Sora 连续一周霸屏后，昨晚，生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Sta...

人工智能 2024-03-20 人工智能

959阅读

不只是高清放大！Magnific AI照片风格化功能上线

Magnific AI的照片风格化功能已经正式上线。这项全新的功能可以将你的任何照片转换成你所期望的任何风格。无论你想变换任何图像，都可以控制传输的样式数量和结构完整性，这为3D、视频游戏、室内设计、娱乐等领域提供了无限的用例。产品入口：https:/...

大数据 2024-03-19 人工智能

954阅读

Stable Diffusion：详细版安装教程！

Stable Diffusion是一种基于扩散过程的图像生成模型，能够创造出高质量、高分辨率的图像。它通过模拟扩散过程逐渐将噪声图像转化为目标图像，具有稳定性和可控性。这一技术不仅能够生成多样化、精美的图像，还能修复损坏的图像，提高图像的清晰度，甚至应...

生成式AI 2024-03-18 人工智能

968阅读

ComfyUI-SUPIR官网体验入口图像放大AI处理工具下载地址

ComfyUI-SUPIR是一个为ComfyUI设计的SUPIR图像放大封装器，它使用先进的AI技术来提升图像质量。该工具目前还在开发中，支持从原始链接下载SUPIR模型，并需要SDXL模型。它适用于非商业用途，并且对系统内存有较高要求。点击前往Com...

大数据 2024-03-18 人工智能

1349阅读

stable diffusion采样详解

采样：模型会在Latent Space中生成一个完全随机的图像，然后噪声预测器会从图像中减去预测的噪声。随着这个步骤的不断重复，最终得到一个清晰的图像。 Stable Diffusion在每个步骤中都会生成一张新的采样后的图像，整个去噪...

大数据 2024-03-18 人工智能

1180阅读

Stable Diffusion XL on diffusers

Stable Diffusion XL on diffusers 翻译自：https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Dif...

大数据 2024-03-17 人工智能

934阅读

高清视频采集卡：技术革新与多媒体应用的交汇点

随着科技的飞速发展，高清视频已经成为我们日常生活中不可或缺的一部分。无论是在家庭娱乐、教育领域，还是在专业的广播电视、安防监控等领域，高清视频都扮演着至关重要的角色。而在这场视觉盛宴的背后，高清视频采集卡作为关键技术支撑，正发挥着越来越重要的作用。本文将深...

AIGC 2024-03-16 大数据

933阅读

零一万物大模型开放平台体验入口 01-ai API接口使用地址

零一万物大模型开放平台是一个通过API调用获取高品质Yi系列大模型的平台。Yi系列模型基于零一万物的前沿科研成果和高品质数据训练而成，曾在多个权威榜单中获得SOTA表现。主要产品包括yi-34b-chat-0205、yi-34b-chat-200k和y...

人工智能 2024-03-15 人工智能

1053阅读

Stable Diffusion 3 震撼发布，采用Sora同源技术，生成图像、视频真假难辨！

ChatGPT狂飙160天，世界已经不是之前的样子。新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 ============== Stable Diffusion 3...

人工智能 2024-03-14 人工智能

900阅读

【Stable Diffusion初学者指南】如何为Stable Diffusion提出良好的提示

文章目录初学者资源剖析一个好的提示主题风格艺术家网站分辨率额外细节灯光颜色良好提示的提示一些适合您的关键词风格艺术家网站分辨率灯光额外细节颜色概括快速构建是任何Stable Diffus...

AIGC 2024-03-14 人工智能

934阅读

Hotshot - ACT 1官网体验入口文生视频AI系统使用方法教程指南

Hotshot - ACT 1是一个由Hotshot Research开发的直接文本到视频合成系统，它能够生成高清晰度的视频，具有多种宽高比且无水印，提供引人入胜的用户体验。该系统通过使用大规模高分辨率文本视频语料库进行训练，以实现高保真度的空间对齐、时间...

AIGC 2024-03-13 人工智能

871阅读

CRM官网体验入口 AI图像处理3D建模神器免费在线使用地址

CRM是一个高保真的单图像到3D纹理网格的生成模型，它通过整合几何先验到网络设计中，能够从单个输入图像生成六个正交视图图像，然后利用卷积U-Net创建高分辨率的三平面（triplane）。CRM进一步使用Flexicubes作为几何表示，便于在纹理网格上进...

人工智能 2024-03-12 人工智能

887阅读

关于AI和ChatGPT的使用，AI编程（AIGC），AI绘画（2）

AI绘画技术是指利用人工智能技术来创作、生成或修改图像、照片、插图、漫画等艺术品以及各种视觉效果。常见的AI绘画技术包括机器学习、深度学习和计算机视觉等领域的技术，通过训练神经网络模型来实现自动化地生成图像，其应用范围相当广泛，包括数字媒体...

大数据 2024-03-12 人工智能

793阅读

无线通信的AI和6G技术

随着技术的变化，人工智能(AI 和6G技术的结合——无线通信的下一件大事，可能会改变我们连接、交谈和生活的方式。根据一些专家的说法，未来6G网络的潜力可能使互联网设备的最高速度达到每秒1太比特(Tbps 。这一速度将比目前最快的1 Gbps速度快100...

人工智能 2024-03-11 人工智能

951阅读

AI绘画普及课【二】文生图入门

文章目录二、文生图入门与提示词基础 1、提示词基本概念 2、提示词分类和书写方式 (1 人物及主题特征 (2 场景特征 (3 环境光照 (4 补充：画幅视角 (5 画质提示词 (6 画风提示词 (7 提示词模板 3、权重与...

AIGC 2024-03-11 人工智能

1568阅读

UnlimitedBG官网体验入口 AI图像处理去背景抠图工具使用方法教程指南

UnlimitedBG是一款 AI 驱动的工具，可在几秒钟内自动删除图像背景，实现专业品质的效果。无限照片，一次固定费用！无需互联网连接！适用于商业和个人用途。点击前往UnlimitedBG官网体验入口谁可以从UnlimitedBG中受益？ Unli...

大数据 2024-03-11 人工智能

777阅读

视频采集卡软件：数字化影像捕获的核心利器

在数字化时代，视频采集卡软件已经成为许多专业领域，如广播电视、多媒体教学、视频会议、安防监控等不可或缺的技术工具。视频采集卡软件作为连接模拟信号与数字世界的桥梁，其实时性、稳定性和兼容性等特点直接影响着数字影像的质量和传输效率。本文将详细探讨视频采集卡软件...

大数据 2024-03-11 大数据

917阅读

图片采集工具的发展与应用前景

在数字化时代，图片作为一种直观、生动的信息载体，在各个领域都发挥着重要作用。无论是新闻报道、广告设计、社交媒体，还是科学研究、教育培训，都离不开图片的支持。而图片采集工具，作为获取和管理图片资源的关键技术，其发展与应用也日益受到人们的关注。一、图片采集工具...

大数据 2024-03-11 大数据

899阅读

星光影视系统采集插件：数字时代的影视制作利器

在数字技术和网络技术迅猛发展的今天，影视制作行业正经历着前所未有的变革。传统的影视制作流程繁琐、效率低下，已经难以满足现代观众对于多元化、高质量内容的需求。而“星光影视系统采集插件”的出现，正是为了应对这一挑战，为影视制作人员提供了一款高效、便捷、强大的工...

生成式AI 2024-03-11 大数据

872阅读

Stable Diffusion 插件AnimateDiff

AnimateDiff简介该插件主要用来制作动图，并不能用来生成比较长的视频，我体验着和pika差不多，效果上照着商用还有不小的距离。在githup的网址中有论文地址和许多示例。 githup：GitHub - guoyww/AnimateDiff:...

生成式AI 2024-03-10 人工智能

1504阅读

【AI绘画】Stablediffusion图片高清放大的最好方法（1）

在接触AI绘画不久后，不知道很多小伙伴们在浏览别的朋友跑出来的图，有没有这样的感想，为什么别人跑出来的图是这样的？？？或者这样的：而我们辛辛苦苦跑出来的图是这样的：那么到底是哪里出了问题呢？本期内容，我将会以三点来讲解如何出一副...

人工智能 2024-03-09 人工智能

940阅读

AI图像合成技术的新浪潮：Stable Diffusion 3与Sora构架的突破

在人工智能的黄金时代，图像合成技术正以前所未有的速度发展。从简单的图像编辑到复杂的场景生成，AI的能力已经超越了传统软件的限制，开启了创意和视觉表达的新纪元。近期，Stable Diffusion 3技术报告的流出引起了业界的广泛关注，其背后的Sora构...

人工智能 2024-03-08 人工智能

924阅读

【AIGC】AI作图最全提示词prompt集合（收藏级）

目录一、正向和负向提示词二、作图参数你好，我是giszz. AI做图真是太爽了，解放生产力，发展生产力。但是，你是不是也总疑惑，为什么别人的图，表现力那么丰富呢，而且指哪打哪，要什么有什么，而你只能等着AI“智能推荐”？从多次重复中...

AIGC 2024-03-07 人工智能

5995阅读

基于视频采集模块的现代监控技术探析

在当今数字化时代，视频监控系统以其高效性、便捷性及安全性的特点，已经成为城市安全管理和社会治安管理不可或缺的一环。而作为监控系统的“眼睛”和“耳朵”，视频采集模块发挥着举足轻重的作用。本文将围绕视频采集模块的功能原理、技术特性以及在现代社会的多元化应用等层...

人工智能 2024-03-07 大数据

963阅读

探讨外置视频采集卡的原理、应用与未来发展趋势

在数字化和信息化高度发展的时代，视频处理技术显得尤为重要。特别是在视频录制、编辑、传输等方面，随着技术的不断创新和完善，外置视频采集卡应运而生，它作为视频处理的一个重要环节，扮演着不可或缺的角色。本文将对外置视频采集卡的原理、应用领域及未来发展趋势进行深入...

大数据 2024-03-07 大数据

932阅读

ResAdapter官网体验入口 Stable Diffusion AI图片生成风格一致性工具免费使用地址

ResAdapter是一个为扩散模型（如Stable Diffusion）设计的分辨率适配器，它能够在保持风格域一致性的同时，生成任意分辨率和宽高比的图像。与处理静态分辨率图像的多分辨率生成方法不同，ResAdapter直接生成动态分辨率的图像，提高了推理...

AIGC 2024-03-06 人工智能

905阅读

【AI绘画】Stable Diffusion使用入门教程！！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）首先提几个好玩的名词：炼丹：训练AI学习图片生成模型咒语：prompt提示词一、prompt提示词 1...

大数据 2024-03-06 人工智能

1488阅读

北大发起复现Sora，框架已搭！袁粒田永鸿领衔，AnimateDiff大神响应

重磅：北大团队联合兔展发起了一项Sora复现计划——Open Sora。框架、实现细节已出：初始团队一共13人：带队的是北大信息工程学院助理教授、博导袁粒和北大计算机学院教授、博导田永鸿等人。为什么发起这项计划？因为资源有限，团队希望集结...

人工智能 2024-03-04 人工智能

817阅读

ComfyUI-SUPIR官网体验入口图像放大AI处理软件下载地址

ComfyUI-SUPIR是一个为ComfyUI设计的SUPIR图像放大封装器，它使用先进的AI技术来提升图像质量。该工具目前还在开发中，支持从原始链接下载SUPIR模型，并需要SDXL模型。它适用于非商业用途，并且对系统内存有较高要求。点击前往Com...

AIGC 2024-03-02 人工智能

1357阅读

首批类Sora模型出现，色拉布上线Snap Video，效果优于Pika、不输Gen-2

最近，OpenAI 视频生成模型 Sora 的爆火，给基于 Transformer 的扩散模型重新带来了一波热度，比如 Sora 研发负责人之一 William Peebles 与纽约大学助理教授谢赛宁去年提出的 DiT（Diffusion Transf...

人工智能 2024-03-01 人工智能

922阅读

Midjourney 超详细使用教程（一）

参考文章：Midjourney 使用基础教程https://kaiho.cc/how-to-use-midjourney/ Midjourney是一个基于人工智能的图像生成工具，它允许用户通过简单的文本提示创建高度详细和创意的图像。这个工具使用了先进的深...

大数据 2024-03-01 人工智能

1588阅读