-
CVPR2024|Diffusion模型轻量化与计算效率优化
前言 做算法应该都有顶会梦吧,发不了顶会只能刷一刷顶会了哈哈,向顶会大佬学习 扩散模型的训练和推理都需要巨大的计算成本(显卡不足做DDPM的下游任务实在是太难受了),所以本文整理汇总了部分CVPR2024中关于扩散模型的轻量化与计算效率优化 的相关论文...
-
Stable Diffusion的商业化应用:市场潜力与挑战
Stable Diffusion的商业化应用:市场潜力与挑战 引言 技术背景与工作原理浅析 商业化应用实例 市场机遇与增长趋势 面临的挑战与限制 创新与未来展望 引言 在这个数字化的时代,人工智能已经渗透到了我们生活的方方面面,而...
-
ComfyUl提示词技巧
ComfyUI prompt技巧 Prompt 输入不支持中文,建议使用翻译插件或者使用翻译软件来进行翻译。 翻译插件推荐:沙拉查词(opens in a new tab ?prompt 书写有什么技巧?要如何写AI绘图的prompt 在Comfy...
-
基于LORA的Stable Diffusion模型在虚拟试衣中的应用
基于LORA的Stable Diffusion模型在虚拟试衣中的应用 引言 1.1 简述虚拟试衣的市场背景和技术需求 1.2 介绍LORA与Stable Diffusion模型的结合在虚拟试衣领域的潜力 1.3 强调基于LORA的Stable...
-
Datawhale X 魔搭 AI夏令营(AIGC Task3)学习笔记
目录 认识ComfyUI 1. 什么是 ComfyUI 2. ComfyUI 核心部件 3. ComfyUI 图片生成流程 4. ComfyUI 的优势 使用ComfyUI 下载ComfyUI: 运行ComfyUI: 自我学习: LOR...
-
弹幕背后:B站UP主创作服务解析
引言 在B站,每一条飘过的弹幕都是一个故事的碎片,它们汇聚成一幅幅生动的社交画卷。这里,不仅仅是一个视频分享平台,弹幕背后更是一个充满活力的创作者生态系统。B站以其独特的弹幕文化,为创作者和观众之间搭建起了一座互动的桥梁,让创意与情感在虚拟空间中自由...
-
Datawhale X 魔搭 AI夏令营 - AIGC方向(task01笔记)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、基础知识 二、实现步骤 1.克隆存储库: 2. 安装环境,然后重启kernel 3. 调整prompt 总结 前言 赛题介绍...
-
基础模型在亚马逊的BEDROCK测试
前 言 通过 Amazon Bedrock,开发者可以轻松使用多种最新领先基础模型(FM)进行构建。本实验中,您将了解和体验到在 Amazon Bedrock 中模型的基础使用方法,以便您快速构建强大安全的大语言模型(LLM)应用,其中包括:...
-
AI二创「黑神话」点燃全网!爆改二郎神,送自家狗子一键「成精」
【新智元导读】国产3A顶流《黑神话·悟空》,与AI联动起来了!网友纷纷开启二创,有人用AI续写神话,有人把自家二哈变成了精怪,甚至还有人自制了桌面壁纸! 全球玩家鏖战《黑神话·悟空》! 已经有打通关的玩家了,我不羡慕,因为通关后的空虚寂寞马上就会找上你们。...
-
非Transformer时代到来!全新无注意力模式超越Llama传奇
来源 | 机器之心 ID | almosthuman2014 Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。 此后,采用 Mamba 架构的模型...
-
开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡(六)
一、前言 本篇文章将使用LLaMA-Factory去合并微调后的模型权重,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。 二、术语介绍 2.1. LoRA微调 LoRA (Low-Ra...
-
强推8款AI写作工具,从此不用发愁写文章!
在数字化与智能化浪潮的推动下,AI写作工具已成为内容创作者、职场人士及学生群体不可或缺的高效助手。这些工具利用先进的自然语言处理技术和深度学习算法,能够自动生成高质量的文章、报告、文案等,极大地提升了写作效率与品质。以下是一系列精选的AI写作工具集合介绍,...
-
AI能直接生成海报了,我愿称Ideogram为新晋之王。
大半夜的,可能是我认为做海报、做logo、做文字最猛的AI绘图产品,Ideogram,更新了他们的2.0版本。 把文字嵌入和整个图片的美学质量,又一次推上了巅峰。 可能很多人不知道Ideogram。 在AI绘图里面,这个产品确实也有一点冷门。 不过并不妨...
-
Midjourney提示词-动物系列-50
an anthropomorphic horse hyperdetailed photography, Hyperdetailed, Unreal Engine, Cinematic Lighting, Blacklight, Photorealistic...
-
如何确保AI写作质量上乘? 笔灵AI,强大模型支撑,精准高效
在这个信息爆炸的时代,写作技能如同一把钥匙,为每个人开启知识的大门。然而,当我们凝视着空白的纸张或屏幕上的光标时,往往感到无从下笔,仿佛置身于创作的荒漠。但请放心,我有一个好消息要告诉你:那就是笔灵AI写作——你的智能写作伙伴!它如同一位无形的导师,随时准...
-
即刻体验 Llama3.1就在Amazon Bedrock!
引言 在人工智能的浪潮中,大型语言模型(LLMs)不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列,以其卓越的性能和广泛的应用前景,引起了业界的广泛关注。现在,激动人心的消息来了——Llama3.1 已经在 Amazon Be...
-
MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions
Paper name MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions Paper Reading Note Paper URL: ht...
-
Midjourney提示词-动物系列-38
a Tiny delightful Anthropomorphic adventurer cat, in intricate detailed leather armor, standing in the forest, soft fairy lighti...
-
AIGC在影视制作中的新趋势
AIGC在影视制作中的新趋势 文艺复兴的序章:AIGC与影视制作的邂逅 开启新篇章:AIGC如何重塑影视行业的面貌 个人视角:我眼中的AIGC革命 指引之旅:本文将揭示AIGC如何革新影视创作的每一个角落 时间的轨迹:AIGC技术的前世今生...
-
Stable Diffusion秋叶WebUI V4.9整合包来了,超详细安装教程,轻松看懂
这款整合包可以一键在本地部署Stable Diffusion!!适用于零基础想要使用AI绘画的小伙伴~ 秋叶大佬V4.9整合包给大家准备好了,扫描下方,即可免费获取 秋叶整合安装包安装教程 如果你的电脑时第一次安装,需要先下载启动器运行依赖,安装依...
-
崔大宝:大模型降温背后的难点、卡点、节点
进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧; 消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了…… 热闹的大概只剩下两场酣仗:自5月15日字节跳动宣布“...
-
如何写好提示词?《Midjourney常用关键词大全》-附关键词文件
Midjourney如何写好提示词从而生成高质量图片? 并且随心所欲生成各种风格的图片? 这是一份关于Midjourney常用关键词的文件: 风格形式/摄影构图/灯光材质/渲染方式/常见设备/常见元素等不同类别, 关键词分门别类,...
-
网络爬虫必备工具:代理IP科普指南
文章目录 1. 网络爬虫简介 1.1 什么是网络爬虫? 1.2 网络爬虫的应用领域 1.3 网络爬虫面临的主要挑战 2. 代理IP:爬虫的得力助手 2.1 代理IP的定义和工作原理 2.2 爬虫使用代理IP的必要性 3. 代理IP的类型...
-
国产AI机器人好超前…弹琴泡茶打咏春,还能撸猫??
什么水平,让海外最火AI机器人Figure的CEO都第一时间关注? 国产人形机器人大秀肌肉,最新技能居然是弹琴泡功夫茶……和颠勺?! 手握琴竹,精准轻巧敲击每根琴弦,演奏动听音乐。 熟练泡一壶功夫茶,十几道工序、数个杯壶轻松拿捏。 搞定一份香喷喷的华夫饼...
-
写作难题?试试这5款免费AI写作工具,让工作总结和文案更高效!
作为一个运营打工人,经常面临需要快速输出高质量文案的挑战,这不仅耗费时间也极易造成创作疲劳。AI写作工具的出现极大缓解了这一困境。AI写作工具,简直就是运营人员的救星,极大提升了写作效率,让文案创作变得轻松而高效。 今天,我要分享几款免费的AI写作工具,...
-
一键收藏!5组 Stable Diffusion 常用人物提示词!
Stable Diffusion 是近年来最火的 AI 绘画工具之一,能够生成高质量的图片。想要使用 Stable Diffusion 生成人物图片,需要使用人物提示词来引导模型生成想要的效果。 以下是 5 组常用的 Stable Diffusion 人...
-
AI绘画SD写实模型,逼真的人物风格,简直不要太简单,新手小白看完也可以一键出图
大家好我是安琪!!! 随着AI技术的飞速发展,AI绘画在艺术创作领域中崭露头角。而Stable Diffusion(SD),一款基于深度学习的图像生成模型,以其强大的图像生成能力和个性化风格迁移能力,在艺术创作领域掀起了一场革命。本文将带你深入了解Sta...
-
超逼真AI生成电影来了!《泰坦尼克号》AI重生!浙大&阿里发布MovieDreamer,纯AI生成电影引爆热议!
视频生成领域的最新进展主要利用了短时内容的扩散模型。然而,这些方法往往无法对复杂的叙事进行建模,也无法在较长时间内保持角色的一致性,而这对于电影等长篇视频制作至关重要。 对此,浙大&阿里发布了一种新颖的分层框架MovieDreamer,它将自回归...
-
常见的反爬手段和解决思路(爬虫与反爬虫)
常见的反爬手段和解决思路(爬虫与反爬虫) 学习目标 1 服务器反爬的原因 2 服务器长反什么样的爬虫 (1)十分低级的应届毕业生 (2)十分低级的创业小公司 (3)不小心写错了没人去停止的失控小爬虫 (4)成型的商业对手 (5)抽风的搜索引擎...
-
OpenAI引爆搜索革命——揭秘SearchGPT原型
?OpenAI引爆搜索革命——揭秘SearchGPT原型 大家好,我是猫头虎。今天,我迫不及待地想和大家分享一个超酷的新玩意儿——SearchGPT原型。这可是一个能够颠覆我们搜索体验的AI搜索功能原型。你准备好了吗?? 猫头虎是谁? 大家好,...
-
Stable Diffusion是什么?
目录 一、Stable Diffusion是什么? 二、Stable Diffusion的基本原理 三、Stable Diffusion有哪些运用领域? 一、Stable Diffusion是什么? Stable Diff...
-
国产可图大模型:厚积薄发,GLM3加持质的飞跃,ComfyUI最全指南与SD3综合评比孰更强?
?大家好!我是安琪!!! Kolors大模型简 就在上周末,国内大厂快手开源了可图大模型文生图模型,这是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。 • Kolors 是在数10亿图文对下进行训练, • 在 视觉质量、复杂语...
-
AIGC 全面介绍
随着人工智能技术的不断进步,生成式人工智能(AI Generated Content, AIGC)成为了一个日益热门的话题。AIGC 指利用人工智能技术生成各类内容,包括文本、图像、音频、视频等。与传统的内容生成方法相比,AIGC 具有速度快、成本低、可定...
-
Fish Speech: 开源文本转语音技术(TTS)的新里程碑
简介 Fish Speech 是一个全新的文本转语音(TTS 解决方案,该项目由fishaudio开发。当前模型使用约十五万小时三语数据训练,对中文支持非常的完美。 能够熟练处理和生成中文、日语和英语的语音,语言处理能力接近人类水平,并且声音表现形式丰...
-
探索中文智能的未来:Chinese-LLaMA-Alpaca-3 项目深度解析
探索中文智能的未来:Chinese-LLaMA-Alpaca-3 项目深度解析 Chinese-LLaMA-Alpacaymcui/Chinese-LLaMA-Alpaca 是一个基于 LLaMA 的中文自然语言处理模型。适合在自然语言处理、机器学习和...
-
有没有针对特定场景的写作模板? 笔灵AI写作,多场景覆盖,一键生成
在当前这个信息爆炸的时代背景下,掌握写作技能对于每一位个体而言,无疑是至关重要的。然而,面对着一张洁白的纸张或是电脑屏幕上闪烁的光标,我们往往容易陷入灵感的荒漠,茫然不知所措。今日,本人拟向大家推荐一款能够有效助您创作出高品质作品的智能写作助手——笔灵AI...
-
盘点目前有关数字人的开源项目
近年来,数字人技术的迅猛发展吸引了众多研究者和开发者的关注。开源社区也涌现出许多优秀的项目,为数字人技术的发展提供了强有力的支持。本文将对一些目前较为热门的数字人生成相关开源项目进行分类整理和总结,以供广大开发者和研究人员参考。 一、动画人像生成与动作...
-
拓数派亮相2024浙江嘉兴“数据要素×”大赛,数据平台产业项目签约落地
近日,“智汇南湖 数据赋能”2024数据产业发展大会暨2024年“数据要素×”大赛浙江分赛嘉兴站颁奖仪式圆满落幕。拓数派首席运营官陆公瑜受邀出席本次大会,并代表拓数派进行数据产业项目签约仪式。 图为:大会现场 我国数字经济蓬勃发展,数据生产量和存储...
-
Chameleon:Meta推出的图文混合多模态开源模型
目录 引言 一、Chameleon模型概述 1、早期融合和基于token的混合模态模型 1)早期融合的优势 2)基于token的方法 2、端到端训练 二、技术挑战与解决方案 1、优化稳定性问题 2、扩展性问题 3、架构创新 4、训练技...
-
重磅!Stable Diffusion 3 终于免费开源了!吊打 Midjourney,附本地安装包教程!
前言 stable Diffusion 3 终于开源了,他的开源瞬间在AI界得到火爆追捧,曾一度吊打Midjourney等一系列收费AI软件,最主要的是它可以免费使用呦!下面我们来看一下他到底有多强大。 stable Diffusion 3 Me...
-
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗? 全球数据告急,怎么办? 论文来凑! 最近,Nature的一篇文章向我们揭露了这样...
-
Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?
【新智元导读】最近的论文表明,LLM等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅8B的Llama3.1模型搜索100次,即可在Python代码生成任务上达到GPT-4o同等水平。 强化学习先驱、加拿大阿尔伯塔大学...
-
写作没灵感怎么办? 笔灵AI写作,你的创意源泉
在数字化信息爆炸的当今社会,掌握写作技巧对每一位个体而言显得尤为重要。然而,当面对着空白的页面或是不断闪烁的文本光标,人们往往会在创意的荒漠中迷失方向,难以找到下笔的起点。在此,本人将向您推荐一款能够高效助力您产出高品质文本的智能写作助手——笔灵AI写作!...
-
AI绘画指南!白嫖那些免费的云端SD(解决sd部署麻烦、开不了机等问题)
目前,使用Stable Diffusion进行图像生成主要有两种部署方式:本地部署和云端部署。 本地部署对硬件配置有较高的要求,尤其是显卡的性能。对于觉得配置高性能显卡太贵或者用mac的小伙伴(比如我)来说,满足这些要求可能会...
-
超越sd3!比肩Midjourney-v6?AI绘画大模型FLUX1.0详细评测与本地部署方法(附安装文件)
FLUX.1模型是什么? FLUX模型是一个开源的AI图像生成模型,由黑森林工作室研发。 堪比sd3以及Midjourney-v6 背景/backdrop 黑森林工作室(Black Forest...
-
Llama 3.1用了1.6万个英伟达H100 GPU,耗费......
目录 Llama 3.1发布简介 Llama 3.1模型规模与训练 大模型企业发展面临的问题与困境 算力和能耗算力方面 数据和资金方面 技术和人才方面 Llama 3.1发布简介 当地时间 2024年 7月 23号,Meta 公司发布...
-
Stable Diffusion 模型下载:epiCPhotoGasm(真实、照片)
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 文章目录 模型介绍 生成案例 案例一 案例二 案例三 案例四 案例五 案例六...
-
超算互联网-Stable Diffusion 2.1文生图教程
一、名词简介 1. 超算互联网 超算互联网是一种基于云计算的高性能计算平台,用户可以通过互联网接入超级计算资源。它集成了大量的计算节点,提供强大的计算能力,适用于科学计算、深度学习、人工智能等领域。用户可以利用超算互联网平台运行复杂的模型和算法,显...
-
AIGC前沿 | LivePortrait
0. 资源链接 论文超链接: LivePortrait 项目: https://github.com/KwaiVGI/LivePortrait 1. 背景动机 现有AIGC存在的问题 随着智能手机和其他录制设备的普及,人们越来越频繁地...
-
开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory(五)
一、前言 本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。 二、术语介绍 2.1. LoRA微调 LoRA (Low...