-
20240131在WIN10下配置whisper
20240131在WIN10下配置whisper 2024/1/31 18:25 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的545版本的驱动程序...
-
Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj
安装llama-cpp-python包时,出现下述问题: Collecting llama-cpp-python Using cached llama_cpp_python-0.2.28.tar.gz (9.4 MB Installing bu...
-
20240127在ubuntu20.04.6下配置whisper
20240131在ubuntu20.04.6下配置whisper 2024/1/31 15:48 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的驱动...
-
AI绘画:PhotoMaker Win11本地安装记录!
昨天介绍一个叫PhotoMaker的AI绘画开源项目。挺不错的! 通过这个项目可以快速制作特定人脸的AI绘画作品,相比传统的技术效果会好很多,效率也高很多。 今天趁热打铁,本地电脑装装看,并且记录,分享一下! 本文主要面向有一定配置基...
-
一张照片定制AI拜年视频,悄悄惊艳所有亲戚(附教程)
有了AI,现在这春节过得越来越“科幻”了。 前两天我们刚送出用AI绘画制作的微信红包封面,现在又流行起了AI拜年视频—— 小红书@蜡笔年糕 小红书@爱宠大酱 抖音@老麦的工具库 是不是看起来有点眼熟?没错,一个月前火爆全网的“科目三”AI视频也是这样...
-
LLaVA:GPT-4V(ision) 的开源替代品
LLaVA(大型语言和视觉助理)(链接::https://llava-vl.github.io/)是一个很有前途的开源生成式人工智能模型,它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中,允许讨论这些图像...
-
陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好
Transformer的技能树是越来越厉害了。 来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校(UIUC)的研究人员发表了一篇论文,利用大语言模型自动生成定理的完整证明。 论文地址:https://arxiv.org/pdf/2303.04910...
-
Stable Diffusion - Prompts 提示词工程框架
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131544508 当前 Stable Diffusion 模型使用...
-
AIGC面经大全(持续更新)
目录 DDPM算法原理部分: DDIM算法原理部分: ⾼阶采样⽅案: 特征编码篇: Stable Diffusion篇: SDXL篇: ⼤模型微调篇: 控制模型篇: 适配器篇: DDPM算法原理部分: 简述DDP...
-
ChatGPT4.0 >ChatGPT 3.5 > 文心一言
文章目录 前言 一、ChatGPT4.0与ChatGPT3.5相比具有以下优点: 二、ChatGPT和文心一言相比具有以下优点: 总结 前言 ChatGPT是一种基于自然语言处理的对话型人工智能模型,由OpenAI开发。它是使用...
-
【MIdjourney】图像角度关键词
本篇仅是我个人在使用过程中的一些经验之谈,不代表一定是对的,如有任何问题欢迎在评论区指正,如有补充也欢迎在评论区留言。 1.侧面视角(from side 侧面视角观察或拍摄的主体通常以其侧面的特征为主要焦点,以便更好地展示其轮廓、形状、特征和轮廓线条...
-
【扩散模型】万字长文全面理解与应用Stable Diffusion
万字长文全面理解与应用Stable Diffusion 1. Stable Diffusion简介 1.1 基本概念 1.2 主体结构 1.3 训练细节 1.4 模型评测 1.5 模型应用 1.6 模型版本 1.7 其他类型的条件生成模型 1...
-
2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架
摘要: 2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架 LangChain指南-打造LLM的垂域AI框架 CHATGPT以来,Langchain 可能是目前在 AI 领域中最热门的事物之一,仅次于向量数据库。...
-
深入浅出完整解析Stable Diffusion(SD)核心基础知识
2022年,Stable Diffusion模型横空出世,其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一,并为工业界,投资界,学术界以及竞赛界都注入了新的AI想象空间,让AI再次性感。 Stable Diffusion是计算机视觉领域的...
-
Ai绘画-Midjourney常用关键词
一、视角关键词 视角 关键词 近距离景 Tight Shot 两人/物景 Two Shot (2S , Three Shot (3S , Group Shot (GS 三人/物景 Three Shot (3S , Gro...
-
AIGC内容分享(四十八):AIGC与创意设计之Canva:还是那个邻家女孩
目录 亲切温暖的邻家女孩 魔法室里魔法多 体验篇之:Magic Design 体验篇之:Magic Edit 创作者激励计划 结语 平易近人、积极向上,如邻家女孩般温暖,这或许就是用户对 Canva 的整体印象。 亲切温暖的邻...
-
Windows 11 大更新:Copilot 终于来临, 全面接入 GPT-4
2023年6月30号,微软终于在6月最后一天推出的开发者预览版更新,支持Windows Copilot。这次更新没有延迟,可算是互联网界的一股清流。接下来,我们来看一下Windows Copilot能够实现什么功能。 上个月,软总裁萨蒂亚·纳德拉(S...
-
Stable Diffusion XL总结
Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refi...
-
Mac安装Stable Diffusion
第一步:安装anaconda https://www.anaconda.com/download 第二步:下载代码 # 创建虚拟环境sdtest1 conda create -n sdtest1 python=3.10 # 激活虚拟环境sdtest1...
-
利用 “diart“ 和 OpenAI 的 Whisper 简化实时转录
利用 "diart" 和 OpenAI 的 Whisper 简化实时转录 工作原理 Diart 是一个基于人工智能的 Python 库,用于实时记录说话者语言(即 "谁在什么时候说话"),它建立在 pyannote.audio 模型之上,专为实时音频流...
-
记录Stable-Diffusion-Webui 在Windows11的Anaconda环境下的避坑安装
#记录工作,工作复盘 仅作记录,未尽之处请补充,谢谢! 电脑配置情况大致记录如下,请参考: MSI移动工作站,64G内存,4GB显存 一、安装前准备: 阅读文档,明确软件依赖和安装要求: 在用Anaconda环境下安装stable-diff...
-
高效底座模型LLaMA
论文标题:LLaMA: Open and Efficient Foundation Language Models 论文链接:https://arxiv.org/abs/2302.13971 论文来源:Meta AI 一、概述 大型语...
-
怎么快速转行并学习提示工程师的方法
chatgpt的出现毫无疑问打破了原有的商业格局, 各个公司都已逐渐使用chatgpt来取代人工,反正老板总是提出各种逆天的要求,但chatgpt可不一定听得懂,雇一个翻译那可真是一个好主意 -------------提示工程师 以往要费几天功夫的...
-
人工智能AI大战:BARD、ChatGPT、Bing和文心一言谁更具有优势?
首先在开始对比之前我首先要吐槽,不管是bard还是百度的AI现在都得等待候补,也就是排队,所以目前只能无限期等待下去,但是第一批用户已经在查通过平台上遨游了好几个月了,从商业的角度来看,几个月或许不长,但是足以失去了超过80%的用户,所以chatgpt目前...
-
Altman地位又危了?!OpenAI董事会邀请竞争对手加入,还挖角谷歌Gemini高管
Altman的地位又危险了? 据知情人士透露,上个月,OpenAI董事会的Adam D'Angelo致电Databricks的首席执行官Ali Ghodsi,询问Ghodsi是否考虑加入OpenAI董事会。 Adam D'Angelo 本来找知名公司高...
-
CVPR 2023 | 风格迁移论文3篇简读,视觉AIGC系列
CAP-VSTNet: Content Affinity Preserved Versatile Style Transfer 内容相似度损失(包括特征和像素相似度)是逼真和视频风格迁移中出现伪影的主要问题。本文提出了一个名为CAP-VSTNet...
-
一文读懂Stable Diffusion 论文原理+代码超详细解读
背景 Stable diffusion是一个基于Latent Diffusion Models(LDMs)实现的的文图生成(text-to-image)模型。 2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院(Théâtre...
-
OpenAI悄然放弃承诺,大量公司内部文件不再公布
1月25日消息,自成立以来,人工智能初创公司OpenAI一直秉持公开透明的原则,承诺向公众开放其内部文件。然而,去年11月的人事变动似乎标志着这一承诺的改变。《连线》杂志要求获取这些文件的副本,却遭到了出人意料的拒绝。 2015年,埃隆·马斯克(Elo...
-
stable diffusion推理过程代码梳理
最近在看stable diffusion,想梳理一下代码流程,以便之后查阅 从txt2img.py开始看 1.首先是对文本进行编码 (1)调用的是 stable-diffusion/ldm/models/diffusion/ddpm.py的get...
-
GitHub 数据库 15 年进化史:幕后英雄如何成就 Copilot 传奇
自 2008 年成立以来,GitHub 的数据库系统经历了多次重大的演变,以适应不断增长的用户基础和不断变化的技术需求。GitHub 一直使用 MySQL 数据库,其中保存了除了 git 代码仓库以外的其他所有元数据,诸如用户,issue,PR, Gist...
-
扩散模型实战(十):Stable Diffusion文本条件生成图像大模型
推荐阅读列表: 扩散模型实战(一):基本原理介绍 扩散模型实战(二):扩散模型的发展 扩散模型实战(三):扩散模型的应用 扩散模型实战(四):从零构建扩散模型 扩散模型实战(五):采样过程 扩散模型实战(六):Diffusers DDPM初探...
-
纯LiDAR 3D检测路在何方?时序递归TimePillars:直接干到200m!
基于LiDAR点云点3D Object Detection一哥是一个很经典的问题,学术界和工业界都提出了各种各样的模型来提高精度、速度和鲁棒性。但因为室外的复杂环境,所以室外点云的Object Detection的性能都还不是太好。而激光雷达点云本质上比...
-
AIGC专栏2——Stable Diffusion结构解析-以文本生成图像(文生图,txt2img)为例
AIGC专栏2——Stable Diffusion结构解析-以文本生成图像(文生图,txt2img)为例 学习前言 源码下载地址 网络构建 一、什么是Stable Diffusion(SD) 二、Stable Diffusion的组成 三、生...
-
测评结果:免费的“文心一言3.5”香,但是付费的产品质量更高
文章目录 前言 一、文心一言3.5生成的图片和文章 1.文心一言生成的图片 在文心一言3.5中输入以下内容: 我的测评结果: 2.文心一言生成的文章 在文心一言3.5中输入以下内容: 我的测评结果: 二、ChatGPT生成的图片和文...
-
英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大
昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天,英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下,在 10...
-
Midjourney词库
光线与影子篇 闪耀的霓虹灯 shimmeringneon lights 黑暗中的影子 shadows in the dark 照亮城市的月光 moonlightilluminatingthe city 强烈的阳光 strong sunlight...
-
Stable Diffusion1.5网络结构-超详细原创
目录 1 Unet 1.0 介绍 1.1详细整体结构 1.2 缩小版整体结构 1.3 时间步编码 1.4 CrossAttnDownBlock2D 1.4.1 ResnetBlock2D 1.4.2 Transformer2DModel...
-
Stable Diffusion 源码解析(1)
参考1:https://blog.csdn.net/Eric_1993/article/details/129393890 参考2:https://zhuanlan.zhihu.com/p/613337342 1.StableDiff...
-
四种通过LLM进行文本知识图谱的构建方法对比介绍
我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知识图谱。但是对于知识图谱的创建是一个很复杂的过程,比如需要对属性增加限制,创建符合特定主题/模式的图谱,并且有时文档非常大,无法作为单个提示处理,所以在切分后的提示中创建的图谱需要前后一致。...
-
2023-12-30 AIGC-LangChain介绍
摘要: 2023-12-30 AIGC-LangChain介绍 LangChain介绍 1. https://youtu.be/Ix9WIZpArm0?t=353 2. https://www.freecodecamp.org/news/la...
-
我用 midjourney 创作的那些好看的图片
下面这些是个人的midjourney v5的关键词,各种类型都有 抽象画 One piece of original artwork from 1998 , in the style of confucian ideology, pop art-in...
-
GPT-5不叫GPT-5?OpenAI CEO曝出AGI即将来临,重点押注核聚变
最近,Sam Altman又在达沃斯论坛上语出惊人,在大部分他出现的场合都成了全场的焦点。 他表示,现在的GPT-4模型的能力只是对未来技术所能达到可能性的一种「预览」。 他认为,AI技术的进步,将使世界变得变得越来越快,而人类只能看到前方「几步」,但...
-
人工智能 | ChatGPT 和文心一言哪个更好用?
===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u01134...
-
调查显示:25%全球CEO预计生成式AI将导致2024年至少裁员5%
在达沃斯,瑞士的世界经济论坛召开之际,一项由PwC进行的调查显示,全球四分之一的首席执行官预计,生成式人工智能的部署将在今年至少导致5%的员工裁员。在这项调查中,媒体、银行、保险和物流行业的首席执行官最有可能因先进的AI工具而预测到裁员,而工程和建筑公司以...
-
SDXL 1.0出图效果直逼Midjourney!手把手教你快速体验!
介绍 最近,Stability AI正式推出了全新的SDXL 1.0版本。经过我的实际测试,与之前的1.5版本相比,XL的效果有了巨大的提升,可以说是全方位的超越。不仅在理解提示词方面表现出色,而且图片的构图、颜色渲染和画面细腻程度都有了很大的进步,实际...
-
深入浅出解析Stable Diffusion完整核心基础知识 | 【算法兵器谱】
Rocky Ding 公众号:WeThinkIn 最新更新: Rocky也一直在更新Stable Diffusion系列的文章内容,包括最新发布的Stable Diffusion XL。Rocky都进行...
-
微软CEO纳德拉:全球正在就人工智能形成广泛共识
1月17日消息,当地时间周二微软首席执行官萨蒂亚·纳德拉(Satya Nadella)表示,他发现全球在人工智能方面正在形成共识。纳德拉认为,尽管各国对监管这项技术的方式方法可能不同,但探讨人工智能的方式都很相似。 纳德拉在瑞士达沃斯举行的世界经济论坛...
-
最佳Midjourney动漫相关风格提示词,值得收藏
先补充概念,后面慢慢补图片咯 动漫艺术家 下面是一些最伟大的艺术家的名单 Hayao Miyazaki, Co-founder of Studio Ghibli(宫崎骏,吉卜力工作室的共同创始人) Eiichiro Oda, One Piece(...
-
【生成模型】Stable Diffusion原理+代码
文章目录 前言 一、Latent space 二、AutoEncoder 和 VAE 1.AutoEncoder: 2.VAE: 三、Diffusion扩散模型 1.前向过程 2.逆向过程 四、多模态 cross attention 五...
-
GPT-4、百度文心一言摆擂,AI大模型将掀起新一轮AIGC军备竞赛?
科技云报道原创。 一觉醒来,万众期待的GPT-4来了。OpenAI老板Sam Altman直接开门见山地介绍说:“这是我们迄今为止功能最强大的模型!”仅隔一天,“中国版ChatGPT”百度文心一言正式发布,双方大有摆擂之势。 当深度学习推动AI技术...