-
揭秘Stable Diffusion:由线稿到绚丽效果图的深入学习
做设计的伙伴都知道SD的强大,但是,对于使用是有一定的门槛的,熟练之后,做设计那是得心应手,特别是室内设计,建筑设计,好了,接下来,我们开始今天的分享。文末扫码可免费获取AI绘画资料。 一、SD模型三大在线平台 分享stable diffusion模型...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图
目前人工智能模型可以分为两大类别,包括判别模型 (Discriminative Model 与生成模型 (Generative Model 。判别模型根据一组输入数据,例如文本、X 射线图像或者游戏画面,经过一系列计算得到相应目标输出结果,例如单词翻译结...
-
每日AIGC最新进展(22):中国科学院大学提出Zoro-shot视频插帧算法、Adobe研究院提出高效视频扩散模型的叠加网络搜索架构SNED、蚂蚁集团提出视频深度估计算法ChronoDepth
Diffusion Models专栏文章汇总:入门与实战 ZeroSmooth: Training-free Diffuser Adaptation for High Frame Rate Video Generation 本文提出了一种名为Z...
-
一个提问高下立见?国产AI大模型冲上扣子广场PK
以“国产GPTs”出名的扣子,做出了GPT没有的功能。 6月12日,字节跳动旗下的AI应用开发平台“扣子”(Coze国内版)悄悄上线了新功能“模型广场”。 扣子是AI应用开发平台,无论用户是否有编程基础,都可以在扣子上快速搭建基于大模型的各种聊天机器人(...
-
美国退役四星上将,加入OpenAI董事会
6月14日凌晨,OpenAI在官网宣布,美国陆军退役四星上将、前美国网络司令部司令、前国家安全局局长、前中央安全局局长,Paul M. Nakasone(中曾根)加入董事会和安全委员会。 中曾根将把他几十年的军方实战网络安全经验带到OpenAI,为Chat...
-
当AI与数学同时走下神坛
2024年4月13日,一场特别的考试开考。 数万名分散在全球各地的数学高手,在这一天早上8点打开了阿里巴巴全球数学竞赛预赛的试卷,他们有48小时,来攻克20分的选择题和100分的解答题。过去的6届,天才们在这个赛事里亮相,有17岁拿下IMO满分金牌的北大神...
-
Dream Machine API功能介绍及免费使用指南 LumaAI视频生成接口体验地址入口
Dream Machine API简介 Dream Machine API 是一款专注于自动化视频生成的技术工具。它通过使用 Dream Machine API 来生成视频,并异步检查视频生成状态,最终输出最新生成的视频链接。这款工具为需要自动化视频生成和...
-
过完618,我把用AI客服的店给拉黑了
陈杰最近快被AI客服搞疯了。 趁着618,陈杰买了两件衣服,但因为尺码不合适,其中一件需要退货。因为信用良好,平台自动同意了他7天无理由退货的申请,但快递员却始终没有上门取货。 眼看7天就要过去,陈杰联系了店铺的客服,想知道这种情况该如何处理。然而不管他发...
-
tokenpocket(钱包):tp199.app、Stable Diffusion 科技本地部署教程3.0版本
Stable Diffusion 本地部署教程 概述: Stable Diffusion 是一个开源的软件项目,旨在提供一个稳定和可靠的消息传递系统。本文将介绍 Stable Diffusion 的本地部署教程,帮助用户在自己的计算机上搭建和运行 Sta...
-
Llama 3 CPU推理优化指南
备受期待的 Meta 第三代 Llama 现已发布,我想确保你知道如何以最佳方式部署这种最先进的 (SoTA LLM。在本教程中,我们将重点介绍如何执行仅权重量化 (WOQ 来压缩 8B 参数模型并改善推理延迟,但首先,让我们讨论一下 Meta Lla...
-
用 Unsloth 微调 LLaMA 3 8B
用 Unsloth 微调 LLaMA 3 8B 今年4月份,Meta 公司发布了功能强大的大型语言模型(LLM)Llama-3,为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而,传统的 LLM 微调过程既耗时又耗费资...
-
Stable Diffusion AI绘画:绘画参数与原理全攻略参上!千万别错过!
一、基础模型和外挂VAE模型 Ⅰ. 基本术语讲解 基础模型(大模型/底模型):属于预调模型,它决定了AI图片的主要风格。 VAE模型:全称Variational auto enconder变分自编码器,它类似于图片生成后的滤镜。 “基础模型”和...
-
【AIGC X UML 落地】通过多智能体实现自然语言绘制UML图
前天写了篇博文讲到用PlantUML来绘制C++类图和流程图。后台有读者留言,问这步能否自动化生成,不想学习 PlantUML 语法。 我想了下,发现这事可行,确实可以做到通过自然语言的描述就能实现 UML图的绘制,昨天晚上加了个班到凌晨,做了两个智能体...
-
腾讯元宝APP上线,AIGC产品的未来何去何从?
目录 腾讯元宝APP上线,AIGC产品的未来何去何从? 一、大模型AIGC产品概览 二、使用体验分享 1. 百度大脑 2. 阿里巴巴的AliMe 3. 字节跳动的TikTok AI 4. 腾讯元宝APP 小结 三、独特优势和倾向选择...
-
AI功能仅两款iPhone能用!苹果被存储卡了脖子
快科技6月13日消息,据媒体报道,苹果最新推出的Apple Intelligence功能因存储限制而无法在所有设备上使用,这一限制暴露出苹果在端侧AI发展上的存储瓶颈。 据知名分析师郭明錤分析,iPhone 15系列中仅有15 Pro和Pro Max两款型...
-
【多线程】进程与线程
???来都来了,不妨点个关注叭!?博客主页:欢迎各位大佬!? 文章目录 1. 操作系统 2. 进程 2.1 进程是什么 2.2 进程管理 2.3 进程调度 2.3 内存管理 2.4 进程间通信 3. 线程 3.1 线程是什么 3...
-
“探索AIGC市场:腾讯元宝APP加入竞争,大模型产品的未来走向与个人选择“
文章目录 每日一句正能量 前言 使用体验分享 独特优势和倾向选择 字节豆包 百度文心一言 阿里通义千问 腾讯元宝 个人倾向选择 结论 未来发展方向 技术创新 可持续可拓展性 用户体验 应用场景 政府赋能 数据安全与隐私保护 伦理与社会责任...
-
快速识别你家的猫猫狗狗,教你用ModelBox开发AI萌宠应用
本文分享自华为云社区《ModelBox-AI应用开发:动物目标检测【玩转华为云】》,作者:阳光大猫。 一、准备环境 ModelBox端云协同AI开发套件(Windows)环境准备【视频教程】 二、应用开发 1. 创建工程 在Model...
-
ai写作哪个软件好用?ai扩图软件
论文大纲作为论文的纲要和导航,其重要性不言而喻。幸运的是,借助AI PaperPass这一工具,我们可以轻松获得免费的论文大纲,为我们的论文写作提供有力的指导和支持。 ▼输入【学科】+【论文题目】+【字数】 AI论文,免费大纲,10分钟3万字 ,查重高...
-
Moki AI视频创作:美图短片剪辑配乐工具简介及使用方法详解
Moki 是什么? Moki是美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。基于美图自研的奇想智能大模型(MiracleVision),通过智能剪辑、自动配乐、音效添加和字幕生成等功能,大幅简化视...
-
AI日报:Luma AI文生视频模型炸裂程度堪比Sora;Stable diffusion 3 正式开源;Suno正式发布音频输入功能;阿里发布超级“融图”工具MimicBrush
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Luma AI推重磅级文生视频...
-
探索艺术新边界:Stable Diffusion 在艺术领域的创新应用
一、引言 在当今数字化时代,人工智能技术的飞速发展正在改变着各个领域,艺术领域也不例外。Stable Diffusion 作为一种强大的人工智能绘画工具,为艺术家们提供了全新的创作可能性。本文将探讨 Stable Diffusion 在艺术领域的应用,以...
-
运行stable-diffusion出现的问题(1)
Checkout your internet connection or see how to run the library in offline mode at ‘https://huggingface.co/docs/transformers/ins...
-
Win11画图AI最低要求40 TOPS:还必须登录微软帐户
快科技6月13日消息,微软在Build 2024上推出了名为Cocreator的画图AI功能,这是一款集成在画图应用中的人工智能工具,可以根据用户的文本提示和草图生成图像。 在近日的支持文档更新中,微软确认该功能需要登录帐户,并且仅适用于拥有40TOPs...
-
小米字节联手!小爱同学接入豆包大模型:手机、SU7已搭载
快科技6月13日消息,据字节旗下火山引擎”公众号介绍,小米旗下人工智能助手小爱同学”与火山引擎达成合作,双方基于豆包大模型实现更智能的AI交互体验。 据悉,字节跳动打造的豆包大模型,每日能够高效处理数量多达1200亿个的文本tokens、生成3000万张内...
-
stable diffusion官方版本复现
踩了一些坑,来记录下 环境 CentOS Linux release 7.5.1804 (Core 服务器 RTX 3090 复现流程 按照Stable Diffusion的readme下载模型权重、我下载的是stable-diffusio...
-
抖音博主用AI绘画将各地美食变成怪兽进攻人类 福建网友”胆寒“!
抖音博主“一条咸鱼微”通过AI绘画技术,将各地的美食创意性地转化为一系列怪兽形象,这些作品在社交媒体上引起了广泛关注。以下是这一创意项目的主要内容: 创意转化:山东的大葱变成了拥有“血盆大口”和通红双眼的“大葱怪”,而杭州的“西湖醋鱼”则被想象成了类似...
-
Windows部署语音转文字项目_Whisper
Windows部署语音转文字项目_Whisper 一、前置安装准备 Github源仓库,Whisper 下载安装whisper及其依赖项 官方有两种部署方法,一种是通过默认pip源拉取安装: 以管理员身份运行powershell,输入如下命令p...
-
AI绑定硬件 你会为Apple Intelligence买单吗?
2024年的苹果全球开发者大会(WWDC),AI显然是万众瞩目的重头戏,1小时44分钟的大会,AI部分就占了40多分钟。 北京时间6月11日凌晨,苹果在WWDC的前一个小时里更新了iOS、iPadOS、MacOS等操作系统,而且还首次更新了visionOS...
-
Llama 3 最强开源模型?深入剖析Meta Llama 3技术细节
Meta 最近宣布推出了其最新力作——Meta AI,这是一款先进的人工智能聊天机器人,由公司最新且功能强大的 Llama 3 模型驱动。 自 OpenAI 推出广受欢迎的 ChatGPT 以来,众多顶尖企业纷纷涉足这一领域,竞相推出自己的 AI 聊...
-
我们最近跟刚融了8000万美元的Pika聊了聊,它有点儿想成为 AI 版的 TikTok
6月5日,AI 视频生成工具 Pika 宣布了它新近完成的8000万美元 B 轮融资。领投方是风险投资机构 Spark Capital,参与本轮投资的还有 Greycroft 、光速创投(Lightspeed Venture Partners)、Neo、M...
-
移动开发最新Midjourney从入门到实战:图像生成命令及参数详解(1),2024年最新h5面试问题
学习路线+知识梳理 花了很长时间,就为了整理这张详细的知识路线脑图。当然由于时间有限、能力也都有限,毕竟嵌入式全体系实在太庞大了,包括我那做嵌入式的同学,也不可能什么都懂,有些东西可能没覆盖到,不足之处,还希望小伙伴们一起交流补充,一起完善进步。 这...
-
免费开放!Lumalabs AI推出Dream Machine文生视频模型
6月13日,3D建模平台Luma AI推出了一款名为Dream Machine的新型文生视频模型,并向所有用户免费开放。Dream Machine不仅支持文本生成视频,还能利用图片作为引导来创造视频内容。其生成的视频在质量、动作一致性、色彩、光影、饱和度和...
-
微软AI PC全面“亮剑”!Copilot融入Windows 11,GPT 4o“很快”加持
本周二举行Build年度全球开发者大会前,微软先举行了重磅新品发布会。继3月首次推出将人工智能(AI)功能结合到个人电脑(PC)的首批AI PC后,微软又将旗下AI助手Copilot全面融入Windows系统,AI PC全面“亮剑”。 美东时间5月20日...
-
AI绘画Stable Diffusion提示词(Prompt)原理详解,扫盲级教程还请收藏!
阅读本文大概需要 7.88 分钟。 点击上方?名片后,送你 AI 资料 本文主要分为五部分: 1. 提示词概念详解 2. 提示词分类 & 提示词书写 提示词权重原理 & 负面提示词介绍 4. SD 出图参数详解...
-
Stable Diffusion【进阶篇】:真人漫改之图生图实现
所谓真人漫改,就是把一张真人的图片生成一张新的二次元的图片,在Stable Diffusion中,有很多方式实现,其中通过图生图的方式是最常用的方式,大概1-3分钟就可以完成,本文我们系统的讲解一下。 、 下面我们来详细看一下图生图实现真人漫改...
-
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码:绝对位置、相对位置、旋转位置编码
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 文章目录 [从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 1. 位置编码 1.1 绝对位...
-
02:从文生图初窥Stable Diffusion,一键玩转AI绘画
前言 Stable Diffusion是一个什么架构呢,或者说是由哪些部分构成,各自发挥着怎么样的作用。我们就先从文生图开始探索 文生图 我们打开Stable Diffusion的webui,然后选择Stable Diffusion模型,然后选择...
-
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感 我们不会被人工智能所取代,但极大可能会被善于使用人工智能的人所取代 时至今日,我都忘了我是怎么与这本书结缘的了。 是见猎心喜吧,当时看出版日期挺新的 大约是23年12月的时候,我...
-
coze保姆级教程:用coze图像流挑战一下抖音刚火的AI古风画卷
继黏土,毛毡娃娃之后,抖音最近又流行了一款新滤镜——AI古风画卷,用户只需上传一张照片,就可以“一秒入画”,分分钟变成工笔画中的主角。 目前,这个滤镜才刚小火,只有94.8万人在用。不过基本上刷抖音,两三个就能刷...
-
苹果与OpenAI官宣合作:四大科技巨头深受影响
快科技6月12日消息,在刚刚结束的苹果全球开发者大会(WWDC 上,苹果宣布与OpenAI达成合作,这一战略联盟预计将对AI领域竞争格局产生重大影响。 首先,苹果通过与OpenAI的合作,为其自主开发AI技术赢得了宝贵时间。这一合作不仅有助于苹果将先进的A...
-
Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2
距上次Karpathy AI大课更新之后,又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。 大神Karpathy新一期AI大课又上线了。 这一次,他讲的内容是——从头开始实现124M大小的GPT-2模型...
-
AI日报:MJ推模型个性化功能;ComfyUI完成SD3 Medium模型适配;字节上线AI交友“小黄蕉”;微信输入法内测AI功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Midjourney推出模型个...
-
上手GitHub Copilot让AI写代码,效率飞起!
1 GitHub Copilot介绍 GitHub Copilot 由 GitHub 和 OpenAI 共同开发的人工智能代码辅助工具,可自动地生成高质量代码片段、上下文信息等。通过自然语言处理和机器学习技术,通过分析程序员编写的代码、注释和上下文信息...
-
为什么很多AI应用创新往往诞生在中国?
2023年6月,英国《金融时报》一篇名为Gaming industry puts generative AI to the test的深度报道流传于中文互联网。 文中提到了一款名为“Justice Mobile”的手游,游戏中的NPC能跟玩家随意聊天,能和...
-
基于 langchain 和大语言模型 (LLM) 的自然语言数据库查询系统 (RAG)——data copilot
data-copilot ✨ 基于 langchain 和大语言模型 (LLM 的自然语言数据库查询系统 (RAG 通过自然语言提问,使用大语言模型智能解析数据库结构,对数据进行智能多表结构化查询和统计计算,根据查询结果智能绘制多种图表。 Pyw...
-
diffusers flask streamlit或gradio 简洁可视化AIGC文生图页面
参考: https://python-bloggers.com/2022/12/stable-diffusion-application-with-streamlit/ https://github.com/LowinLi/stable-diffusion...
-
AI绘画SD图片高清化+面部修复+一键抠图,一些你不知道的事儿
说到后期处理板块,大家第一印象就是图像放大,快速且高效。但是今天要讲的后期处理当中,肯定还有一些是你不知道的事儿。 # 放大算法 首先是关于放大算法,如果大家用的都是秋叶大佬的整合包的话,算法总共应该就是这些。常用的就是“R-ESRGAN 4x+”...
-
从零开始学AI绘画,万字Stable Diffusion终极教程(五)
【第5期】ControlNet 欢迎来到SD的终极教程,这是我们的第五节课 这套课程分为六节课,会系统性的介绍sd的全部功能,让你打下坚实牢靠的基础 1.SD入门 2.关键词 3.Lora模型 4.图生图 5.controlnet 6.知识...
-
在嵌入式处理器Jetson Orin上使用Whisper做语音内容识别(3)
1、简介 Nvidia的GPU+CUDA架构在大算力时代遥遥领先毫无疑问了,其通用的硬件特性使得它不再是以往的“显卡”,算力强大并且支持各种AI,软件生态的应用方式基本可以照搬PC端。相比于特定的核心NPU,它显得更加灵活,系统和显存的共用在带宽上有明显...