-
超详细!AI 绘画神器 Stable Diffusion 基础教程
一、AI 绘画工具的选择与运用 1. 工作场景下 AI 绘画工具的选择 目前文生图的主流 AI 绘画平台主要有三种:Midjourney、Stable Diffusion、DALL·E。如果要在实际工作场景中应用,我更推荐 Stable Diffusi...
-
Faster-Whisper 实时识别电脑语音转文本
Faster-Whisper 实时识别电脑语音转文本 前言 项目 搭建环境 安装Faster-Whisper 下载模型 编写测试代码 运行测试代码 实时转写脚本 实时转写WebSocket服务器模式 参考 前言 以前做的智能对...
-
了解AIGC在图像识别和生成中的应用
1.背景介绍 在过去的几年里,人工智能(AI 已经成为了我们生活中的一部分,它在图像识别和生成方面的应用也非常广泛。在这篇文章中,我们将探讨一下AI生成式图像识别(AIGC 在图像识别和生成中的应用,以及其背后的核心概念和算法原理。 1. 背...
-
Stable Diffusion【插件篇】:使用After Detailer实现人脸修复
大家好,我是程序员晓晓。 在使用SD绘图的时候,默认的分辨率大小是512*512,这样设置的好处是出图效率高。但是如果涉及到人全身照的时候,经常会出现一个问题:脸部崩。主要原因是在一个比较低的像素画布上,绘制一个全身图,脸部能分配到的像素不够了。我们来看...
-
谷歌官宣TensorFlow-GNN 1.0发布!动态和交互采样,大规模构建图神经网络
2005年,划时代之作「The Graph Neural Network Model」的问世,将图神经网络带到每个人面前。 在此之前,科学家处理图数据的方式是,在数据预处理阶段,将图转换为一组「向量表示」。 而CNN的出现彻底改变这种信息丢失的弊端,近2...
-
Stable Diffusion的数学原理
Stable Diffusion的数学原理 Stable Diffusion是一种深度学习模型,用于生成和操作图像。它主要基于变分自编码器(Variational Autoencoders, VAEs)和扩散模型(Diffusion Models)的结...
-
【AIGC】prompt工程从入门到精通
注:本文示例默认“文心大模型3.5”演示,表示为>或w>(wenxin ,有时为了对比也用百川2.0展示b>(baichuan 有时候为了模拟错误输出,会用到m>(mock 表示(因为用的大模型都会给出正确答案) 有时候直接贴网络...
-
GitHub Copilot 的10种意想不到的使用方法
了解如何将人工智能编程助手的能力扩展到代码生成之外。 作为开发者我们知道,开发应用不仅仅是编写代码,还有一些其他相关工作要做:有提交消息要写,CLI命令要执行,还有晦涩的语法要记住。虽然你可能已经使用GitHub Copilot来支持你的编码,但你知...
-
三个Agent顶个GPT-4,基于开源小模型的那种
真·“三个臭皮匠,顶个诸葛亮”—— 基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果! 话不多说,直接来看两个系统执行记录。 用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。于是指定模型使用Deezer和Shazam的API...
-
【读点论文】A Survey on Generative Diffusion Model,AIGC时代的新宠儿,从原理推导到工程应用,在视觉,自然语言,语音等领域大展拳脚
A Survey on Generative Diffusion Model Abstract 由于深度潜在表示,深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来,扩散模型以其强大的生成能力成...
-
AIGC-Stable Diffusion Webui-AI作画初体验
一、项目地址:传送门:github:stable-diffusion-webui 二、安装方式:本地安装 or Google Colab.(下文介绍中关于安装的部分均以本地安装为例 本地安装: 1、git 2、python(推荐3.10.8 ...
-
【4】Midjourney常用技巧
【常用技巧】 本篇主要讲述MJ的常用技巧,围绕着一些常用指令的使用方法展开。 【版本切换】 在使用MJ时,最常用的技巧之一是版本切换。你可以在输入提示后添加"--v"加上相应的数字来实现版本切换。通常我默认使用MJ 4,偶尔会使用MJ 3或Niji。...
-
探索AI绘画:如何让算法创作美画
1.背景介绍 随着人工智能技术的不断发展,我们已经看到了许多令人惊叹的应用,例如自动驾驶、语音助手、图像识别等。在艺术领域,人工智能也开始发挥着重要作用,尤其是在绘画领域。AI绘画是一种通过算法和机器学习技术创作艺术作品的方法,它旨在让计算机或机...
-
Copilot在PyCharm中可能遇到的问题及其解决方案
尽管GitHub Copilot为PyCharm用户带来了诸多便利,但在实际使用过程中,部分开发者可能会遇到一些问题。下面是一个典型的场景及相应的解决方法: 问题描述: 在启用GitHub Copilot后,在编写Python代码时发现,虽然Copi...
-
aigc修复美颜学习笔记
目录 GFPGAN进行图像人脸修复 美颜 修复畸形手势 GFPGAN进行图像人脸修复 原文:本地使用GFPGAN进行图像人脸修复_人相修复处理网页 csdn-CSDN博客 人脸修复 1.下载项目和权重文件 2.部署环境 3.下载权重文件...
-
Pika:AIGC新秀,视频生成产业或迎来GPT时刻
今天分享的AIGC系列深度研究报告:《Pika:AIGC新秀,视频生成产业或迎来GPT时刻》。 (报告出品方:中泰证券) 报告共计:11页 Pika:专注Text to Video生成场景,支持3D和动漫 ◼ Pika成立于2023年5月,是一...
-
如何在IDEA里面使用GitHub Copilot
GitHub配置 首先需要在GitHub Copilot学生认证或者购买使用产品,然后在GitHub里面的设置有一个Copilot选项,点进去就会发现有一个有效的订阅,此时就可以在idea里使用了,由于我是学生就可以理所当然的白嫖了(狗头 。 ps:学...
-
MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身...
-
人工智能在高等教育中的三种创新应用
高等教育专家必须为与AI的全面协作做好准备,否则很可能错失机会、与学生群体脱节。 根据Tyton Partners最新发布的调查结果,学生在使用生成式AI产品方面的速度远比老师更快。从具体数据来说,教职工群体中的AI频繁使用比例仅为22%,而学生的这一...
-
20240131在ubuntu20.04.6下使用whisper不同模式的比对
20240131在ubuntu20.04.6下使用whisper不同模式的比对 2024/1/31 16:07 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】 2、请正确安装好NVIDIA最新...
-
面向AI工程的五大JavaScript工具
令许多人惊讶的是,一向在Web开发领域中大放异彩的JavaScript在开发使用大语言模型(LLM 的应用程序方面同样大有价值。我们在本文中将介绍面向AI工程的五大工具,并为希望将LLM纳入其项目中的开发人员介绍一些必要的资源。 AI工程市场在2023...
-
ChatGPT和 dalle2 配合生成故事绘本
和 dalle2 配合生成故事绘本 在之前章节中,我们已经尝试过让 ChatGPT 来生成一些故事情节,不管是影视剧还是小说还是游戏都可以。这时候,自然而然的可以联想到:那我们可不可以一步到位,把 ChatGPT 编出来的故事情节,再画成连环画、甚至生成...
-
stable diffusion 使用 faceswaplab插件生成证件照
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一.生成证件照 1.1 下载好需要使用的ckpt 模型和lora 1.2 输入以下提示词 1.3 手动调整画面比例,设置每次生成的图片数 1.4 点击Fac...
-
Copilot在IDEA中的应用:提升编码效率的得力助手
Copilot在IDEA中的应用:提升编码效率的得力助手 前言: 欢迎来到本篇博客,今天我们将深入探讨 GitHub Copilot 在 IntelliJ IDEA 中的应用。GitHub Copilot 是一款由 GitHub 与 OpenAI...
-
阿里云通义千问APP推出春节新应用 一张照片可生成拜年视频
随着春节的临近,阿里云通义千问APP推出了一系列全新的免费应用,旨在让用户在这个喜庆的时刻拥有更多的创意玩法。 其中包括全家福、拜新年、万物成龙等多种图像生成的新体验,提供了超过300套照片模板,让用户可以轻松地通过上传照片来生成全家福、团圆照、拜年照和千...
-
Stable Video Diffusion 1.1 Image-to-Video官网体验入口 AI生成视频模型免费使用地址
Stable Video Diffusion 1.1 Image-to-Video是一款先进的扩散模型,通过将静止图像作为条件帧,生成相应的视频。该潜在扩散模型经过精心训练,能够从图像生成高质量的短视频片段。在 1024x576 分辨率下,该模型训练生成...
-
如何使用MidJourney和ChatGPT制作动画短片?
Ammaar Reshi 当我制作这部使用生成式人工智能制作的蝙蝠侠动画短片时——我不知道它会在不到一周的时间内获得 700 万次观看。 想学!给我们讲解下是整体的制作流程吧!! opus Ammaar Res...
-
AIGC智能编程如何适应并推动开源项目的发展?
AIGC智能编程如何适应并推动开源项目的发展? 开源项目在软件行业中具有重要的地位,它们为开发人员提供了协作和共享代码的机会。AIGC智能编程作为一种创新的编程方法,能够适应和推动开源项目的发展,为开发人员提供更高效、更智能的编程体验。 1. AI...
-
罕见!苹果开源图片编辑神器MGIE,要上iPhone?
拍张照片,输入文字指令,手机就开始自动修图? 这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。 把背景中的人移除 在桌子上添加披萨 最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLL...
-
打脸奥特曼,GPT-4今年比去年还懒!网友在线实测出炉
GPT-4变懒的问题,又有新进展。 就在今天凌晨,奥特曼发推称,GPT-4这个毛病在新的一年应该好多了! 图片 关于GPT-4变懒,网友的吐槽已是不计其数,其中最多的就是与代码相关的任务: 完成度不高不说,还会被分割成一个一个小块,使用时需要逐一复制。...
-
ChatGPT论文:大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较(一)
摘要 ChatGPT的成功引发了一场AI竞赛,研究人员致力于开发新的大型语言模型(LLMs),以匹敌或超越商业模型的语言理解和生成能力。近期,许多声称其性能接近GPT-3.5或GPT-4的模型通过各种指令调优方法出现了。作为文本到SQL解析的从业者,我...
-
大模型系列——解读RAG
RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上,覆盖了结合网络搜索引擎和 LLM 的问答服务,到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构,但什么是RAG呢?R...
-
大模型真能解决一切吗?关于知识驱动自动驾驶的一些思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座,刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的,所以开这么个帖子把其中一些关...
-
拥抱AIGC,应用AIGC,「AIGC短视频+数字人运营学习路线图」30天挑战。
交流学习,联系我V:YuanRangEDU 第 01 天(周一): 分组,破冰,自我介绍,AI工具链安装初体验。 GPT,文心一言,Midjourney,Discord,SD,pikalabs,fliki,剪映等等。...
-
【Python爬虫学习】总结了八种学习爬虫的常用技巧
此篇内容小结: 1)基本网页获取 2)爬虫ip被封的6个解决方法 3)爬虫绕过登录 4)Cookies处理 5)应对反爬的小招 6)验证码处理 7)gzip 压缩 8)爬虫中文乱码问题 基本网页获取 首先向一个 Url 地址发送请求,随后远端...
-
VS Code 1.86版本亮点介绍:强化窗口缩放自由度,引入AI语音助手与多文件差异编辑器"
微软于2月2日发布了Visual Studio Code(VS Code)1.86版本,此次更新带来了多项重要功能升级和改进,旨在提升开发者的使用体验与工作效率。 一、窗口缩放功能优化与个性化设置 微软在Visual Studio Code(VS C...
-
数学建模比赛中,chatgpt、文心一言如何提问更有效?
在数学建模的战场上,ChatGPT和文心一言可是我们的“神助攻”!但想让它们发挥出最大威力,提问可是个技术活。问题问得好,答案跑不了;问题问得妙,解决没烦恼! 下面我就一个实际的对话为例,带大家看看提问的技巧。 首先第一回合,先使用我教给大家的pro...
-
AIGC内容分享(五十三):AIGC|深入浅出一个完整的视频生成系统「VGen」核心基础知识
目录 一、VGen整体架构 二、VGen核心基础内容 三、快速上手使用VGen进行视频生成 四、VGen与SVD的比较 一、VGen整体架构 「VGen」是一个基于扩散模型的视频生成系统,提供以视频生成扩散模型为中心的强大代码库,具有先进...
-
openai-whisper
openai-whisper 0. 参数说明 1. 视频语音转文字 demo 1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕 1. 下载b站视频到电脑 2. 提取视频中的音频 3. 音频转文字 4. 自己的视频去掉音频,增...
-
AIGC 用Midjourney制作绘本
目录 sd生成绘本 用Midjourney制作绘本 绘本故事: 绘本故事分享 ——《冬天来了》 sd生成绘本 用ChatGPT+SD生成一个童话故事绘本 - 知乎 用Midjourney制作绘本 1. 创建绘本故事 第一步,我们...
-
【每周AI简讯】微软Copilot上线安卓和iOS应用
微软Copilot上线安卓和iOS应用 微软在其 Google Play 商店列表中将 Copilot 描述为:“Copilot 是微软的一款开创性聊天助手,由最新的 OpenAI 模型、GPT-4 和 DALL·E 3 提供支持。这些先进的人工智能技术...
-
详解“小而优”的大语言模型Zephyr 7B
Zephyr是Hugging Face发布的一系列大语言模型,使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练,显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码,以应对ChatGPT...
-
AI绘画指南 stable diffusion webui (SD webui)如何设置与使用
根据自己最近的理解与实践,只能说是给后来的AI绘画作画者一点快速上手入门的参考吧。 主要是涉及 SD webui 界面介绍 参数含义及调整,txt2img 怎么设置特征点,img2img 怎么完善原始图像等内容。 stable diffusion w...
-
Stable Diffusion - Prompts 提示词工程框架
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131544508 当前 Stable Diffusion 模型使用...
-
Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw
本文首发于公众号:机器感知 Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw SHViT: Single-Head Vision Transformer with Memory Ef...
-
【AIGC-图片生成视频系列-3】AI视频随心而动:MotionCtrl的相机运动控制和物体运动控制
目录 一. 项目简介 二. 主要贡献 三. 摘要 四. 实现方法和管线 五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...
-
文心一言 VS ChatGPT :谁是更好的选择?
前言 目前各种大模型、人工智能相关内容覆盖了朋友圈已经各种媒体平台,对于Ai目前来看只能说各有千秋。GPT的算法迭代是最先进的,但是它毕竟属于国外产品,有着网络限制、注册限制、会员费高昂等弊端,难以让国内用户享受。文心一言是百度主推的大模型,算法...
-
聊一聊AIGC
“UGC不存在了”——借鉴自《三体》 ChatGPT 的横空出世将一个全新的概念推上风口——AIGC( AI Generated Content)。 GC即创作内容(Generated Content),和传统的UGC、PGC,...
-
最新研究发现,85%的开发人员使用GitHub Copilot和Copilot Chat时对代码质量更有信心
近期,GitHub发布了关于GitHub Copilot Chat的最新研究报告。通过利用自然语言的力量,该研究中的开发人员使用GitHub Copilot Chat实时获取指导、提示、故障排除、补救措施以及针对其特定编码挑战的解决方案,而所有这些都是在不...
-
【书籍】强化学习第二版(英文版电子版下载、github源码)-附copilot翻译的中英文目录...
Python代码:https://github.com/ShangtongZhang/reinforcement-learning-an-introduction 英文原版书籍下载:http://incompleteideas.net/bo...