-
AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
让AI画漫画角色保持一致的新研究来了! 创作的连环画效果belike: 频繁切换主体、人物之间复杂的互动也能保持角色一致性: 上述效果来自AutoStudio,是一个由中山大学和联想团队联合提出的无需训练的多智能体协同框架。 AutoStudio采用基...
-
揭秘AI精准输出:如何构建完美的AIGC提示词?
揭秘AI精准输出:如何构建完美的AIGC提示词?? 文章目录 揭秘AI精准输出:如何构建完美的AIGC提示词?? 摘要 引言 正文 ? 提示词的基本概念 1. 什么是提示词? 2. 提示词的作用 ? 如何编写有效的提示词? 理...
-
了解AIGC:让AI创造内容,改变未来
人不走空 ?个人主页:人不走空 ?系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 什么是AIGC? 定义和概念 ? 关键技术 ? AIGC的发展历程 ?️ 早期阶段:基...
-
【AIGC】深入探索AIGC技术在文本生成与音频生成领域的应用
?文章标题 ?AIGC之文本生成 ?应用型文本生成 ?创作型文本生成 ?文本辅助生成 ?重点关注场景 ?音频及文字—音频生成 ?TTS(Text-to-speech 场景 ?乐曲/歌曲生成 ?场景推荐 随着科技的飞速发展?,...
-
“AIGC第一股”出门问问如愿登录港交所,能否喂饱饥饿的“序列猴子”?
大数据产业创新服务媒体 ——聚焦数据 · 改变商业 创立十二年后,历经两次递表,出门问问终于迎来了上市。 这家由前知名谷歌研究员李志飞创立的专注于提供人工智能服务和智能设备的公司,于今天正式亮相港交所,股票代码 “2438”...
-
五一超级课堂---Llama3-Tutorial(Llama 3 超级课堂)---第三节llama 3图片理解能力微调(xtuner+llava版)
课程文档: https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频: https://space.bilibili.com/3546636263360696/channel/collectiondetail?...
-
百度文心一言API4.0 Python调用ERNIE-4.0-8K详细教程
ERNIE 4.0是百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效,支持5K tokens输入+2K tokens输出。ERNIE-4.0-8K是模...
-
Midjourney Imagine API 申请及使用
Midjourney Imagine API 申请及使用 申请流程 要使用 Midjourney Imagine API,首先可以到 Midjourney Imagine API 页面点击「Acquire」按钮,获取请求所需要的凭证: 如果你尚未...
-
Meta Llama 3 性能提升与推理服务部署
利用 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能 我们很高兴地宣布 NVIDIA TensorRT-LLM 支持 Meta Llama 3 系列模型,从而加速和优化您的 L...
-
Stable Diffusion最好用的高清修复插件
虽说大部分N家显卡都能跑得起来Stable Diffusion,但想要画尺寸更大、更清晰的图片,需要更大的显存。 以12G显存的3060为例,2048大概是单张尺寸的上限,如果画更大的尺寸,大概率会爆显存。 大多数情况下,都是画512小尺寸的图,生成效...
-
在线教程|零门槛部署 Llama 3,70B 版本只占 1.07G 存储空间,新用户免费体验 8B 版本
4 月 18 日,Meta 宣布开源 Llama 3,这个号称「迄今为止最好的开源大模型」一经发布,立刻引爆科技圈! 发布当天恰逢斯坦福大学教授、AI 顶尖专家吴恩达的生日,作为 AI 开源倡导者,他激动地发文表示:这是我收到过最好的生日礼物,谢谢...
-
最新可商用级chatgpt4.0系统源码+Midjourney-AI绘画系统 集成国内外数十个AI大模型和绘画接口
随着科技的飞速发展,人工智能正在逐步改变我们的生活,特别是在艺术创作领域。分享一款最新可商用级ChatGPT 4.0系统源码与Midjourney AI绘画系统的完美结合,集成国内外数十个AI大模型与绘画接口,为创作者们带来了前所未有的智能创意体验。...
-
Llama网络结构介绍
LLaMA现在已经是开源社区里炙手可热的模型了,但是原文中仅仅介绍了其和标准Transformer的差别,并没有一个全局的模型介绍。因此打算写篇文章,争取让读者不参考任何其他资料把LLaMA的模型搞懂。 结构 如图所示为LLaMA的示意图,由Atte...
-
AI绘画Stable Diffusion, 如何利用SD垫图实现照片风格转换
“ 小红书上有很多用AI做卡通头像的,大概思路是你拍一张个人照片发给博主,博主利用midjourney的垫图功能转换成卡通形象,一张收取一定费用……” 今天给大家分享,利用Stable Diffusion(以下简称SD)的垫图功能,实现真人照片风格转换。...
-
一文实现Llama 3 图片理解能力微调(XTuner+LLaVA 版)
本次实验基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。实验平台为InternStudio,实验所用的显存为24G。 =============目录=...
-
ChatGPT 去年至今 0 增长;Sora 风暴仍未停歇,大量 AIGC 视频应用涌现 | AI 头条
一分钟速览新闻点! ChatGPT 用户一年 0 增长,AI 创业公司涌现 UT 奥斯汀推出 StreamingT2V 视频生成技术 DeepDataSpace 发布 T-Rex2,无需训练即可精准识别视频中的各种对象 DALL-...
-
2024 年该如何利用 MidJourney 创作AI艺术(详细教程)
什么是 Midjourney Midjourney 是根据文本提示创建图像的生成式人工智能的优秀范例。与 Dall-E 和 Stable Diffusion 一样,它已成为最受欢迎的人工智能艺术创作工具之一。与竞争对手不同的是,Midjourney 是...
-
文心一言使用体验(彩色图例)
一、初识文心一言 在我日常生活和工作中,信息检索和处理一直是一个重要的环节。无论是学术研究、市场分析,还是个人兴趣探索,快速准确地获取信息都是至关重要的。然而,随着互联网信息的爆炸式增长,如何高效地从中筛选出有价值的信息,成为了我面临的一...
-
大象AI写作 我是如何编写一套属于自己的Prompt提示词的
本文背景 我们在写提示词的时候,AI对COT少量样本的学习能力很重要。 要编写出一套出色的内容创作提示(prompt ,关键在于如何教GPT进行自我创作,这就是一门“know how”的艺术。 比如当你要AI写一个视频标题,初学者只是简单地...
-
Stable Diffusion【进阶篇】:图片中指定元素的移除
大家好,在图像处理中,去掉图片中不想要的元素是一种常见的应用场景,比如去掉图片中的水印、旅游拍的照片中P掉路人等等。随着AI技术的普及,目前可以精准地抹除掉照片中不想要的元素。今天我们分享在SD中2种实现图片中指定元素的移除方法。(文末附籽料) 我们以下...
-
优化你的WordPress网站:内链建设与Link Whisper Pro插件的利用
文章目录 内链的重要性 WordPress SEO插件:Link Whisper Pro 主要功能 使用指南 下载与安装 结语 在数字营销和网站管理领域,SEO内部优化是提升网站排名、增加流量和提高用户参与度的核心策略。在众多SEO...
-
2024最新AI系统【SparkAI】,ChatGPT商业运营版系统源码/ai问答/ai绘画/GPTs,SunoAI音乐生成大模型/带分销AIGC搭建部署教程
一、文章前言 SparkAi创作系统是基于ChatGPT进行开发的ai智能问答系统和Midjourney-AI绘画系统,支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美,那么如何搭建部署AI创作ChatGPT?小编这里...
-
重磅!Stable Diffusion 3.0正式开源!史上最强AI绘画模型!(附安装方法和下载地址)
大家好,我是程序员晓晓 正如承诺的那样,Stability AI在6月12日正式开源了Stable Diffusion 3(Medium版本)!不愧是AI生图领域的“开源英雄”。 接下来就讲讲,怎么在本地部署最新的Stable Diffusion...
-
AIGC——ComfyUI使用SDXL双模型的工作流(附件SDXL模型下载)
SDXL算法概述 SDXL(Stable Diffusion XL)是Stable Diffusion公司发布的一款图像生成大模型。在以往的模型基础上,SDXL进行了极大的升级,其base模型参数数量达到了35亿,refiner模型参数数量达到了66亿...
-
爬虫概念、基本使用及一个类型和六个方法(一)
目录 一、爬虫简介 1.什么是爬虫 2.爬虫的核心 3.爬虫的用途 4.爬虫的分类 5.反爬手段 二、Urllib基本使用 1.导入我们需要的包 2.定义一个url 3.模拟浏览器向服务器发送请求 4.获取响应中的页面的源码 5....
-
AIGC作答《2024年高考作文|新课标I卷》能拿多少分?
AIGC作答《2024年高考作文|新课标I卷》能拿多少分? 一、前言 二、题目 三、作答 一、前言 如火如荼的2024年高考圆满落幕,在如此Happy的时刻,AIGC技术正以其前所未有的热度席卷全球。它不仅改变了我们获取信息的方式...
-
最强AI软件教程来了!教你如何使用stable diffusion快速出景观建筑效果图
<Stable Diffusion效果图教程> 要说哪款AI软件最适合建筑设计类?那必然是midjourney和Stable Diffusion!之前我们也看到了他们生成的图虽然很漂亮,但现有阶段md生成图对我们建筑景观类把控不是很友好,而且...
-
文心一言上线声音定制功能;通义千问开源模型;openAI又侵权?
文心一言上线定制专属声音功能 百度旗下 AI 聊天机器人文心一言上线新功能,用户录音一句话,即可定制声音。 使用这项功能需要使用文心一言 App。在创建智能体中,点击创建自己的声音,朗读系统提示的一句话,等候几秒钟时间,系统就能捕捉到用户的声音...
-
Llama 3 Web Demo 部署- XTuner 小助手微调- LMDeploy 部署 Llama 3
1 Llama 3 Web Demo 部署 本博客为基于机智流、Datawhale、ModelScope:Llama3-Tutorial(Llama 3 超级课堂)的作业。 1.1 环境部署 使用VSCode远程连接InterStudio开发机,并配...
-
SEO文章AI写作VS传统人工创作:全天候高效VS人性创意火花
在数字化飞速发展的今日,通过SEO文章来提升产品/服务以及其相关内容曝光度已然成为众多公司与个人广泛认可且行之有效的途径。伴随人工智能(AI)研究领域取得瞩目的进步,使得AI写作逐渐进入人们视野并被视为SEO文章撰写的发展趋势。那么,究竟什么是 SEO文章...
-
element 树组件 tree 横向纵向滚动条
Html <el-card shadow="hover" > <div slot="header" class="clearfix">...
-
Llama(二):Open WebUI作为前端界面,使用本机的llama3
目录 背景 Open WebUI是什么 工程能力特性 产品功能特性 用户体验特性 Open WebUI安装并使用 背景 Mac M1芯片,16G 内存 llama3 8B的部署参考Llama(一):Mac M1芯片运行Llama3-...
-
用ControlNet+Inpaint实现stable diffusion模特换衣
用ControlNet+Inpaint实现stable diffusion模特换衣 ControlNet 训练与架构详解 ControlNet 的架构 用于文本到图像扩散的 ControlNet 训练过程...
-
李开复、张亚勤对谈:大模型产业化,To B、To C哪个赛道更有机会?
6月15日消息,在第六届“北京智源大会”上,零一万物CEO、创新工场董事长李开复博士,中国工程院院士、清华大学智能产业研究院(AIR)院长张亚勤院士、智源研究院理事长黄铁军教授,三位行业领袖就大模型的成功因素、面临的挑战、产业化场景等多个热点话题展开了深入...
-
【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents
文章目录 一、前言 (一)DALLE2 简介 (二)DALLE2和DALLE的对比 (三)相关模型推出时间 二、文章概要 (一)标题 (二)摘要 (三)引言 (四)模型架构 三、方法 (一)图像生成的相关工作 (二)diffusion...
-
文心一言指令
文心一言 文心一言(ERNIE Bot)是百度公司研发的知识增强大语言模型,它可以根据用户的指令和输入,生成相应的回答或文本。以下是一些可能的指令示例,用于指导文心一言完成不同的任务: 知识问答: 指令:“请问什么是人工智能?” 文心一言将...
-
AIGC中的强化学习技术原理与应用
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
[AIGC] 了解消息队列事务:保证数据一致性的关键
在分布式系统中,消息队列是一种常见的解耦手段,可以帮助我们简化复杂系统的架构设计,提高系统的可靠性和可扩展性。但是,在使用消息队列时,我们需要注意一个重要的问题:保证数据的一致性。在这篇文章中,我们将介绍如何使用消息队列的事务机制来保证数据的一致性。...
-
stable diffusion生成图片权限报错,PermissionError: [Errno 13] Permission denied: ‘/tmp/gradio/tmpidsfdagq.png
因为我这边用的是远程服务器,我没有管理员权限,所以网上其他人说的sudo什么的方法对我都没有用,我又去找了其他的方法,在https://blog.csdn.net/wandererXX/article/details/136935596 这篇博客里面说到了...
-
windows下使用midjourney (一)
一、midjourney是什么? midjourney 是一款AI绘画工具,输入描述自动生成图片。 二、使用步骤 1.安装anaconda 安装之前先在cmd里输入conda看下有没有安装过,没有的话安装一下 安装完成之后,在安装目录下找到....
-
穿越AI写作的迷雾:从困惑到明晰的七大探索
大家好,今天来聊聊穿越AI写作的迷雾:从困惑到明晰的七大探索,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:穿越AI写作的迷雾:从困惑到明晰的七大探索 在AI技术飞速发展的时代,AI写...
-
探秘Whisper Diarization:语音转文字与对话分割的新锐工具
探秘Whisper Diarization:语音转文字与对话分割的新锐工具 项目地址:https://gitcode.com/MahmoudAshraf97/whisper-diarization 项目简介 Whisper Diarization 是...
-
每日AIGC最新进展(23):魁北克人工智能研究所提出扩展注意力机制视频编辑、浙江大学提出video-to-Audio生成算法Frieren、清华大学提出扩散模型参数高效迁移学习Diff-Tuning
Diffusion Models专栏文章汇总:入门与实战 Temporally Consistent Object Editing in Videos using Extended Attention 本文提出了一种用于视频编辑的新方法,旨在通过...
-
文心一言VSchatGPT4
文心一言和GPT-4各有优势,具体表现在不同的测试场景下。 在某些测试场景中心一言的表现优于GPT-4,例如在故事的完整度和情节吸引力方面,文心一言表现得更加符合指令,情节更吸引人。这可能得益于其模型在训练时对中文语境的深入理解和优化。 然而,在代码生...
-
机圈周报:华为鸿蒙HarmonyOS首超苹果iOS 苹果发布自家AI技术
机圈周报,盘点一周新机、配置曝光、机圈热闻,每周更新,欢迎关注。 本周手机圈最大的热点,莫过于苹果WWDC24带来的iOS 18更新,以及自家AI技术Apple Intelligence了,我们这周的机圈周报也会多花一点篇幅讲讲有意思的新功能、新玩法,快来...
-
AI绘画神器ComfyUI 整合包:工作流界面,解压即用,快速入门AI绘画
上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包,让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了,我也安装试用了一下,的确非常方便,今天就为大家详细介绍一下整合包的用法 ~ 一、ComfyUI 简介 ComfyU...
-
微软出于安全考虑推迟推出 AI 功能「Recall」,将先在小范围内预览
微软公司表示,他们将不会在下周发布的新电脑中推出「Recall」功能。这一功能利用人工智能技术跟踪计算机使用情况,但出于隐私风险的考虑,微软决定先在小范围内进行预览。 Recall 功能可以记录从网络浏览到语音聊天的所有历史,并将其存储在电脑上。用户在需...
-
windows11搭建 stable-diffusion-webui
2024年5月22日23:46:57 建议电脑配置 电脑配置: Intel® Core™ Ultra 5 125H 1.20 GHz 32.0 GB (31.6 GB 可用 系统:windows11 注意:最好挂上外网,或者设置好访问github的...
-
苹果把数据卖给OpenAI?这话更像是无事生非
在日前举行的WWDC24上,苹果用“重新命名”AI的Apple Intelligence宣告赶上了AI这班车,随后股价大涨7.3%无疑是市场对于“苹果智能”的积极反馈,并在时隔多日后又重新站上了市值超过3万亿美元的高点。可是,苹果所取得的大好局面似乎让有些...
-
51-34 DALLE2 结合预训练CLIP和扩散模型实现图像生成
今天要分享的论文是OpenAI于2022年4月出品的DALLE2,全名Hierarchical Text-Conditional Image Generation with CLIP Latents。该工作是在CLIP和GLIDE基础之上完成。 很早之前...