-
ICCV 2023 | 最全AIGC梳理,5w字30个diffusion扩散模型方向,近百篇论文!
30个方向130篇!CVPR 2023最全AIGC论文 25个方向!CVPR 2022 GAN论文汇总 35个方向!ICCV 2021 最全GAN论文汇总 超110篇!CVPR 2021 最全GAN论文梳理 超100篇!CVPR 2...
-
whisper-large-v3:速度快的令人翻译模型三种实用的调用方法
1、whisper-large-v3 是openai公司的模型,可使用Python代码调用; 2、whisper-large-v3基础上chenxwh 制作了开源库insanely-fast-whisper ,可本地指令运行,或 Google Colab...
-
中科大等意外发现:大模型不看图也能正确回答视觉问题!
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。 他们首先看到像...
-
小白也能微调大模型:LLaMA-Factory使用心得
大模型火了之后,相信不少人都在尝试将预训练大模型应用到自己的场景上,希望得到一个垂类专家,而不是通用大模型。 目前的思路,一是RAG(retrieval augmented generation ,在模型的输入prompt中加入尽可能多的“目标领域”的相...
-
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到属于 AI 版权法模糊灰色区域的内容。 报道称,OpenAI 迫切需...
-
AI语音识别神器Openai Whisper对中文的支持如何?
文章目录 前言 一、资料准备 二、Whisper环境搭建 第一步:安装whisper 第二步:安装ffmpeg 三、Whisper测试 总结 其他相关 前言 语音识别一直以来都是人工智能领域中一个不容忽视的技术,随着大模型时...
-
AI视频风格转换动漫风:Stable Diffusion+TemporalKit
话不多说,直接开干。 基本方法 首先通过 Temporal-Kit 这个插件提取视频中的关键帧图片,然后使用 Stable Diffusion WebUI 重绘关键帧图片,然后再使用 Temporal-Kit 处理转换后的关键帧图片,它会自动补充关键...
-
AI绘画24年最新的Stable Diffusion整合包安装教程,建议收藏!
1、背景信息 ▍Stable Diffusion 是什么? Stable Diffusion(简称SD)是一种生成式人工智能,于2022年发布,主要用于根据文本描述生成详细图像,也可用于其他任务,如图像的修补、扩展和通过文本提示指导图像到图像的...
-
AI程序员哪家强?探索Devin、通义灵码和SWE-agent的潜力
4月3日,距世界首个AI程序员Devin诞生不足一个月,普林斯顿大学的NLP团队开发了一个开源AI程序员SWE-agent,它利用GPT-4模型在GitHub存储库中自动解决问题。SWE-agent在SWE-bench测试集上的表现与Devin相似,平均...
-
2024-03-21 AIGC-FastGPT-本地知识库问答系统
相关文档: 接入 ChatGLM2-6B | FastGPT (fastai.site 相关步骤: FastGPT配置文件及OneAPI程序:百度网盘 请输入提取码 提取码:wuhe 创建fastgpt目录:mkdir fastgpt...
-
AIGC知识库一周精华
元宇宙、大语言模型和智能设计是当前人工智能领域的重要发展趋势。 元宇宙将虚拟和现实世界融合,开启了新的数字化交互时代。 大语言模型的应用和研究不断推进,提示工程和函数调用等工具不断涌现,为人们提供更高效的文本生成和处理能力。 智能设计领域...
-
20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理
20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理 2024/2/3 21:23 缘起:最近学习stable-diffusion-webui.git,在Ubuntu...
-
【讲解下如何Stable Diffusion本地部署】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! 目录 🎥前言 🎥前提条件 🎥步骤...
-
Stable Diffusion【进阶篇】:如何实现人脸一致
大家好,我是程序员晓晓。 在AI绘画中,一直都有一个比较困难的问题,就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践,大家和我一起来看看吧。 一. 有哪些实现方式 方式1:固定Seed种子值。 固定Seed种子值出来的图片人物确实可...
-
惊喜!4G显卡也能用Stable Diffusion啦
上周六 Stable Diffusion WebUI 发布了 1.8.0 版本。 新版本主要特点如下: 将touch2.1.2更新到版本 2.1.2,提高了稳定性 FP8 支持,新增了对八位精度模型的支持,降低了硬件门槛 支持 SDXL-I...
-
AI绘画SD神器插件Inpaint Anything---简单快速实现换装换脸
大家好,我是程序员晓晓 在AI绘画Stable DIffusion中,有一个 Inpaint Anything算法,可以实现移除、填补、替换一切内容,实现单击图像上的任何物体可以一键擦除替换任何内容、更改任意背景,这可以提高遮罩创建过程的效率和准确性,从...
-
【保姆级】VsCode 安装GitHub Copilot实操教程
0. 前言 GitHub Copilot,俗称“副驾驶”,是GitHub携手OpenAI共同打造的一款革命性的人工智能代码辅助工具。通过将其插件化集成至编辑器(如VS Code),Copilot能够为用户提供强大的代码自动补全功能,并根据用户输入的注释快...
-
学生申请Github Copilot方法
前置准备: 确保自己在学校里,注册过程中会对位置和IP进行检测(同时不要使用科学上网,如果连不上,考虑修改DNS服务器或者修改hosts文件) 学校邮箱: 打开企业微信,点击邮箱,并跟随引导注册邮箱。 学信网报告: 登录学信档案,点击在线验证...
-
Stable Diffusion 推荐硬件配置和本地化布署
Stable Diffusion简介 Stable Diffusion是由Stability AI开发的一种强大的文本到图像(Text-to-Image 生成模型,它能够根据用户提供的文本描述,生成与之相关的高质量、高分辨率图像。下面我从原理、特点、应用...
-
AIGC绘画关键词 - 写实少女
Unity3D特效百例 案例项目实战源码 Android-Unity实战问题汇总 游戏脚本-辅助自动化 Android控件全解手册 再战Android系列 Scratch编程案例 软考全系列 Unity3D学习专栏 蓝桥系列 ChatGPT和...
-
AI绘画新手必看,Stable Diffusion最强修脸插件来了!
在使用Stable Diffuison(以下简称SD)进行AI绘画创作时,经常会遇到,生成一张构图不错的图片,但一看图片中的人脸崩了。。。 虽然可以局部重绘,但效果不佳,很容易看出拼接感。没关系,今天介绍一款SD最强修脸插件——ADetailer。...
-
【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿
说到后期处理板块,大家第一印象就是图像放大,快速且高效。但是今天要讲的后期处理当中,肯定还有一些是你不知道的事儿。 # 放大算法 首先是关于放大算法,如果大家用的都是秋叶大佬的整合包的话,算法总共应该就是这些。常用的就是“R-ESRGAN 4x+”...
-
Stable diffusion下载安装sd-webui-prompt-all-in-one插件
下载地址 prompt-all-in-one https://github.com/Physton/sd-webui-prompt-all-in-one.git Git 手动下载 all-in-one 安装步骤 git clone https...
-
千古绝句的意境,用AI来传承 | 通过 AIGC 作画,生成古诗名词的场景
前言 中华上下五千年,那些在这漫漫历史长河里沉淀但又熠熠生辉的诗词,是中华文明的瑰宝。纵观历代诗词市集,满是千古绝唱的诗句: 或气势惊人的 “君不见黄河之水天上来,奔流到海不复回” 或淡妆浅细的 “疏影横斜水清浅,暗香浮动月黄昏” 或意境空悠的...
-
【AIGC调研系列】通义灵码与copilot的对比
通义灵码与GitHub Copilot的对比主要集中在几个方面:代码编写能力、免费性、操作界面和适配性。 首先,在代码编写能力上,虽然GitHub Copilot在整体上要强于通义灵码,但通义灵码的能力也不算弱,并且在某些特定的小类任务上表现更好[1][...
-
20240203在Ubuntu20.04.6下配置stable-diffusion-webui.git
20240203在Ubuntu20.04.6下配置stable-diffusion-webui.git 2024/2/3 11:55 【结论:在Ubuntu20.04.6下,生成512x512分辨率的图像,大概需要11秒钟!】 前提条件,可以通过技术...
-
AIGC内容分享(五十一):音韵如诗如斯:AIGC音乐创新工具之Suno
目录 Suno是谁? 先听为快 如何使用Suno 歌曲的结构及如何使用Metatags Suno收费吗? Suno的模型 朋友与对手 结语 AI生成音乐是一种创新的音乐创作方式,通过人工智能技术,使任何人都能够轻松地创作出引人入胜的...
-
立省千元!Google Colab上的Stable Diffusion安装教程
写在前面 如果你是一名艺术家或设计师,你可能已经知道了如何使用AI进行创作。不过,对于那些刚刚开始接触AI创作的人来说,可能会对所需要的高性能计算机和昂贵的GPU感到困惑。 使用stable diffusion进行AI绘画创作需要占用大量的内存和计算资...
-
LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调
LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调 文章原始地址:https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/ 引言 大语...
-
【小白】一文读懂AIGC模型之Stable Diffusion模型
目录 模型简介 模型结构 VAE变分编码器 VAE结构 VAE模型训练与损失函数 U-Net结构 CLIP Text Encoder 模型工作流程 参考 模型简介 Stable Diffusion(SD)模型是一种基于...
-
llama-factory简介
llamafactory是什么,能干什么 LLaMA-Factory 是一个易于使用的大规模语言模型(Large Language Model, LLM)微调框架,它支持多种模型,包括 LLaMA、BLOOM、Mistral、Baichuan、Qwen ...
-
AIGC——ComfyUI 安装与基础使用
简介 ComfyUI是一个基于节点流程的稳定扩散操作界面,通过流程实现了更加精准的工作流定制和完善的可复现性。每个模块都有特定的功能,我们可以通过调整模块连接来实现不同的出图效果。然而,节点式的工作流也提高了一定的使用门槛。同时,由于内部生成流程经过优...
-
WebCopilot:一款功能强大的子域名枚举和安全漏洞扫描工具
关于WebCopilot WebCopilot是一款功能强大的子域名枚举和安全漏洞扫描工具,该工具能够枚举目标域名下的子域名,并使用不同的开源工具检测目标存在的安全漏洞。 工具运行机制 WebCopilot首先会使用assetsfind...
-
『SD』零基础快速搭建Stable Diffusion(Windows版)
theme: smartblue 点赞 + 关注 + 收藏 = 学会了 本文简介 本文介绍如何在 Windows 安装 Stable Diffusion WebUI,不需要懂代码,只要跟着本文一步步操作就能在你电脑用AI绘画了。 只...
-
whisper、whisper.cpp、faster-whisper的比较
让我们比较一下当前的whisper、whisper.cpp和faster-whisper。 OpenAI / Whisper 自发布以来,似乎在各个方面都发生了变化,例如在 2022 年 12 月增加了 large-v2 模型和各种版本升级。 whis...
-
首个开源世界模型LWM :百万级上下文,长视频理解超GPT-4
来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型,被称为 LWM(LargeWorldModel)系列模型。这一模型采用了大量视频和书籍数据集,通过 RingAttention 技术实现了长序列的可扩展训练,使得模型的上下文长度达到了1M to...
-
华人开源最强「AI 程序员」炸场,让 GPT-4 自己修 Bug!
自从“AI 程序员”Devin问世之后,近期的一大趋势就是程序员们争先恐后地要让自己失业,试图抢先造出比自己更强大的程序员。 普林斯顿大学为软件工程界迎来了一位新星——SWE-agent,论文将在4月10日正式发布,目前项目已在 GitHub 上开源。...
-
【Python】科研代码学习:十五 configuration,tokenization 的代码细节:Llama 为例
【Python】科研代码学习:十五 tokenizer的代码细节:Llama_Tokenization 为例 前言 `LlamaConfig`:网络参数配置 `LlamaTokenizer`:分词工具 前言 对于 HF 的 Tr...
-
探索未来编程利器:Code GeeX、Copilot、通义灵码
各位小伙伴们,大家好!小米今天给大家带来的是一篇关于未来编程利器的探索文章。近年来,随着人工智能技术的不断发展,我们看到了越来越多的智能编程辅助工具的出现,其中包括了Code GeeX、Copilot和通义灵码。那么,究竟这三种工具各自是什么,又有什么样的...
-
云原生技术赋能AI绘图:Stable Diffusion在腾讯云的部署与应用新篇章
摘要 随着信息技术的飞速发展和数字化转型的深入推进,云原生架构已成为企业数字化转型的重要基石。Docker容器、Serverless和微服务等技术作为云原生的核心组成部分,正在不断推动着企业应用架构的革新与升级。本文旨在总结近期在云原生实践、容器技术、...
-
开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近,有很多人在为 AI 代替自己的工作而担忧。 上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技...
-
华人又来炸场!一个命令工具让GPT-4干掉Devin和RAG!Jim Fan:提示工程2.0没必要了!
出品 | 51CTO技术栈(微信号:blog51cto) 华人又来炸场了!昨天,普林斯顿的CS/NLP硕士生John Yang在Github上开源了一款堪比Devin的利器。不到一天,就在Github上斩获了1.3k 星,异常生猛。据悉,4月10日,详细...
-
元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用
元象发布了 XVERSE-MoE-A4.2B 大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B 模型。该模型全开源,免费商用,可用于海量中小企业、研究者和开发者,推动低成本部署。 该模型具有极致压缩和超凡性能两大优势,采用稀疏激活技术,效果...
-
OS-Copilot:实现具有自我完善能力的通用计算机智能体
🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ AI 缩小了人类间的知识和技术差距 论文标题:OS-Copilot: Towards Generalist Computer Agents with S...
-
Ubuntu 22.04 LTS AIGC GPU环境搭建(NVIDIA 550.67+CUDA 12.4+cuDNN)
Ubuntu 22.04 LTS AIGC GPU环境搭建(NVIDIA+CUDA+cuDNN) 一、服务器信息 1.1 硬件配置 服务器名称 CPU(Intel® Xeon® W-2245) 显卡(NVIDIA Quadro RTX 60...
-
SWE-agent官网体验入口 开源AI程序员使用地址
SWE-agent是什么? SWE-agent是普林斯顿大学推出的首个开源AI程序员,基于GPT- 4 技术,能够自动修复GitHub仓库中的bug。其表现优异,开源性质受到开源社区高度认可。 点击前往SWE-agent官网体验入口 SWE-agent的...
-
面向2026年的推荐算法前瞻
常规的推荐系统范式已经逐渐走入瓶颈,原因是在当前固定化的问题描述下模型和系统几乎已经发展到极限。当前的主要范式在模型上为召回+排序+重排,系统上为样本挖掘+特征工程+线上打分预估能力建设。一线大厂在上述领域已经把空间挖掘殆尽。同时可以看到,我们的用户对当...
-
普林斯顿首个「开源」AI程序员进场 基于GPT-4,可自动修复bug
普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。 SWE-ag...
-
【保姆级讲解如何Stable Diffusion本地部署】
🌈个人主页:程序员不想敲代码啊🌈 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家🏆 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! Stable Diffusion本地部...
-
大模型中常用的注意力机制GQA详解以及Pytorch代码实现
分组查询注意力 (Grouped Query Attention 是一种在大型语言模型中的多查询注意力 (MQA 和多头注意力 (MHA 之间进行插值的方法,它的目标是在保持 MQA 速度的同时实现 MHA 的质量。 这篇文章中,我们将解释GQA的...