-
llama-7B、vicuna-7b-delta-v1.1和vicuna-7b-v1.3——使用体验
Chatgpt的出现给NLP领域带来了让人振奋的消息,可以很逼真的模拟人的对话,回答人们提出的问题,不过Chatgpt参数量,规模,训练代价都很昂贵。 幸运的是,出现了开源的一些相对小的模型,可以在本地或者云端部署体验, 动手体验了下Vicuna-7b...
-
文心一言上线新功能,2 秒即可定制你自己的声音!
点击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 果然,国内的AI大模型,还得是百度AI! 用户在智能体对话中可使用自己的音色进行语音播报,并通过通话按钮与数字分身实时对话,音色和音调与本人一致。...
-
0基础使用LLAMA大模型搞科研,自动阅读论文、代码修改、论文润色、稿件生成等等
0基础使用LLAMA大模型搞科研,自动阅读论文、代码修改、论文润色、稿件生成等等。 使用 LLAMA大模型 辅助科研可以带来多方面的好处和优势,主要包括: 提高文献调研效率: LLAMA大模型 可以帮助研究人员快速获取特定研究领域的概述,提供相...
-
Diffusion Model原理及Stable Diffusion
什么是扩散(diffusion)? 扩散一词来自非平衡热力学(non-equilibrium thermodynamics),在非平衡热力学中扩散过程指的是:“在浓度梯度的驱动下,颗粒或分子从高浓度区域移动到低浓度区域。” 什么是扩散模型(di...
-
Stable Diffusion | Gradio界面设计及API调用
Stability AI 2024年2月发布了 Stable Cascade 模型,但由于该模型较大(fp32格式的 Stage_A + Stage_B + Stage_C 模型超过20GB,ComfyUI 专用 Stage_B + Stage_C 模型也...
-
部署Video-LLama遇到的坑
环境:linux,conda,python 3.10下载:下载时首先在中国直接拉去huggingface的git链接很大概率上实行不同的因为被ban了,如果想下载只能找镜像网站。镜像网站比如modelscope就非常好用,魔搭社区网速非常快!我这边使用的是...
-
CIO访谈:IT当前面临的十大问题
CIO的日程被安排地满满当当,大量关键而复杂的问题占据了他们的时间和注意力。 毫不奇怪,使用AI成了CIO待办事项清单之首,围绕AI设定恰当的期望值、安全性和信任也是如此。管理变革对于当今的CIO来说也至关重要。 这些事项以及其他重大问题是否以及在多大...
-
手机里的夏天,三组非常适合夏天的手机AI壁纸提示词分享
为你的手机换上夏日新装!这里有三组非常适合夏天的手机壁纸提示词,带你感受夏日的热情与活力。每组提示词都充满了夏天的元素,如水果,水池,冰镇饮料等,让你的手机屏幕充满清凉感。快来挑选你最喜欢的风格,迎接美好的夏日时光吧! 这边使用的是iphon15的尺...
-
AIGC笔记--Stable Diffusion源码剖析之UNetModel
1--前言 以论文《High-Resolution Image Synthesis with Latent Diffusion Models》 开源的项目为例,剖析Stable Diffusion经典组成部分,巩固学习加深印象。...
-
在Windows下搭建Stable Diffusion环境中途出错咋弄?
在Windows下搭建Stable Diffusion环境需要以下几个步骤: 安装Git和Anaconda 首先,确保你的计算机上已经安装了Git和Anaconda。如果没有安装,可以分别访问官方网站进行下载和安装: Git: https://git...
-
用 LLama-Factory 训练和微调 LLama3,打造你的专属 AI 模型!
用 LLama-Factory 训练和微调 LLama3,打造你的专属 AI 模型! 文章目录 用 LLama-Factory 训练和微调 LLama3,打造你的专属 AI 模型! 什么是模型微调? 为什么使用 LLama-Fact...
-
基于Llama 3的最强开源医疗AI模型OpenBioLLM-Llama3,刷新榜单
项目概述 OpenBioLLM-70B是一款先进的开源生物医学大型语言模型,由Saama AI实验室基于Llama 3技术精心开发并微调。此模型专为生物医学领域设计,利用尖端技术,在多种生物医学任务中实现了最先进的性能表现。 背景: Saam...
-
[论文阅读] (32)南洋理工大学刘杨教授——网络空间安全和AIGC整合之道学习笔记及强推(InForSec)
首先祝大家五一节快乐!《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学术路上期待与您前行,加油。 本文是南洋理工大...
-
Copilot本地部署:(1)Github学生认证
(1)Github学生认证 a.在github中补全必要信息 ①登录github账号后(没有账号可用邮箱自行注册), 在https://github.com/settings/billing/payment_information中,填写好必填字段(...
-
Midjourney绘画风格关键词总结
我们初次使用AI绘图时,可能会对如何使用关键词营造画面感到迷茫,很多参数需要在提示词中设置,尤其多小白来说不是很好友。所以,掌握一些简单的语法和技巧很重要,下面我们将根据不同的风格列举常用的高质量关键词。 1. 风格关键词 Ink style ...
-
借助ollama实现AI绘画提示词自由,操作简单只需一个节点!
只需要将ollama部署到本地,借助comfyui ollama节点即可给你的Ai绘画提示词插上想象的翅膀。具体看详细步骤! 第一步打开ollama官网:https://ollama.com/,并选择models显存太小选择的是llama3\8b参数...
-
诺奖得主:AI并没有提高工作质量 只让富人更富有
快科技6月19日消息,据媒体报道,在陆家嘴论坛上,诺贝尔经济学奖得主、伦敦政治经济学院经济学教授Christopher PISSARIDES谈及自己对人工智能的看法。 PISSARIDES教授指出,尽管存在AI将取代工作的担忧,但他坚信AI实际上是在创造新...
-
stable diffusion无限贴近真人的调教方法,助力AI变现(下)
对于人像,我的研究重点主要是如何让脸更贴近原图。这篇文章就通过一些专题的实践,讲讲我对还原人脸的一些出图思路、技巧和心得,会从出图思路、优化方向出发,逐步拆解,希望能给大家带来启发。 本篇的重点内容有: 如何根据一张图像还原人脸? 如何使用 stab...
-
Omost - 一句话即可AI绘画,自动生成关键词,本地一键整合包
近日,ControlNet的作者推出了一个全新的项目——Omost。这个项目对现有图像模型的提示词理解有着巨大的帮助。通过很短的提示词,就可以生成非常详细并且空间表现很准确的图片。划重点,这个项目需要8G显存显卡运行,据说老显卡,比如10系可能用不了,具体...
-
AI视频进入有声时代!谷歌发布视频生成音频技术,效果丝滑惊艳网友!
Runway前脚刚发布Gen-3Alpha,Google后脚就跟了个王炸。 北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐,逼真的音效,甚至是人物...
-
【全网瞩目】最强文生图模型,Stable Diffusion 3技术报告解禁
12号,终于在Hugging Face上出现了 Stable Diffusion 3 Medium。没错,正如他所承诺的,最强文生图模型真的开源了。而且此次开源不仅是以SD2的比较下性能得到了更好的升级,同时也向我们展示了最前沿的DiT技术——MMDiT。...
-
Stable Diffusion复现——基于 Amazon SageMaker 搭建文本生成图像模型(3)
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前! 既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上鸿蒙开发知识点,真正体系化!...
-
Llama Factory 笔记
本地环境:cuda 11.7 torch2.1.0 项目文件结构: 1. 项目文件结构: 如果利用Llama Factory 进行微调主要会用到 LLama-Factory/src 中的文件 2. src 下的目录结构 本地推理的...
-
Runway正式发布全新Gen3模型,AI视频的王,它回来了。
在AI视频被一众新秀,比如Sora、Luma、可灵等等占据注意力的时候,已经有人忘了AI视频领域统治了N久的王者,他叫Runway。 去年的11月份更新了一次Gen2模型模型,然后宣布他们要开始组团队开始进军世界模型之后。 他们就再无动静了。 一晃眼,将...
-
利用Python与Whisper革新视频翻译:打造高精度字幕翻译流程。
实现流程需要使用以下的工具。 1.python,需要自行安装, 2.python的音视频处理库moviepy安装 pip install moviepy 3.Whisper语音识别,在我之前的文章中有:Whisper语音识别安装教程。 4.文字翻...
-
AIGC实战测评:助力软件开发的智能神器
目录 AIGC实战测评:助力软件开发的智能神器 引言 AIGC简介 AIGC的功能与优势 智能代码生成 代码质量保证 快速问题解决 知识库与API集成 实战演示 总结 AIGC实战测评:助力软件开发的智能神器 引言 在软件开...
-
Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。 Gemini1.5P...
-
从论文中看AI绘画
个人博客:Sekyoro的博客小屋个人网站:Proanimer的个人网站 主要看是看Diffusion Models,CLIP,ControlNet,IP-Adapter这种经典论文,尝试总结论文写作的一些方式以及图像生成模型的一些内在思想. 对于其中的数...
-
Midjourney 关键词与案例整理
常用关键词 风格 说明 Tradition Chinese Ink Painting 东方山水画 Japanese Ukiyo-e 浮世绘 Japanese comics/manga 日本漫画风格 s...
-
图像生成新篇章:Stable Diffusion 3 Medium开源评析
摘要 在数字艺术与人工智能的交汇点上,Stable Diffusion 3(SD3)的开源无疑是一场技术革新的盛宴。就在3月份,我撰写了一篇博文,深入探讨了SD3的技术报告内容与介绍,文章发表在CSDN博客上,https://blog.c...
-
AI日报:Luma官方亲自下场夸自家“孩子”;日本艺术家用Luma复活妻子看哭网友;苹果AI可能要放大家“鸽子”;北大快手联合推视频生成框架VideoTetris
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Luma 官方发视频介绍Dre...
-
Midjourney基础使用技巧
1.1 常用技巧 本篇主要讲述MJ的常用技巧,围绕相关的常用指令来拓展一些使用方法。 2.1 版本切换 最常用的是版本切换,其实也可以通过在prompt后添加--v加数字 一般我都默认MJ 4,偶尔用 3 或Niji。V4对生物、地方、物体等有更多...
-
基于AI的软件代码开发和调试:如何利用AI提高编程效率?AI在代码调试中的应用有哪些?
什么是基于AI的软件代码开发和调试? 基于AI的软件代码开发和调试是指利用人工智能技术来辅助软件开发过程中的代码编写、优化和调试。这种方法通过自动化和智能化的工具,帮助开发者提高编程效率,减少错误,优化代码质量。 基于AI的软件代码开发的核心功能 1:...
-
代码都让AI写,CS还有前途吗?加州大学伯克利分校:CDSS申请人数飙升48%
AI写了这么多代码,你还应该学习计算机科学吗?新的数据表明,学生们仍然成群结队地在大学里选修计算机:加州大学伯克利分校(UCB)计算机科学专业的一年级申请人数猛增48%!UCB教授分析,AI还没有学会创新,人类软件开发者可以利用AI提质增效。 围绕生成式人...
-
【LLM第二篇】stable diffusion扩散模型、名词解释
最近在整理大模型的相关资料,发现了几个名词,不是很懂,这里整理一下: stable diffusion(SD 模型: 扩散模型(Diffusion model)的一种,主要用于生成高质量的图像,GAN的替代者,扩散模型通过一些列学习步骤生成数据,逐渐从...
-
【亚马逊云新春特辑③】构生成式 AI 文生图工具之借助ControlNet进行AI绘画创作【使用OpenPose优化人物二维码】
文章目录 2.1 使用OpenPose优化人物二维码 1)数据及环境准备 2)导入骨架数据并启用OpenPose控制单元 3)导入二维码并生成美化后的二维码图片 2.1 使用OpenPose优化人物二维码 在上一节体验到了使用...
-
whisper使用
whisper使用 1. 直接调用 语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...
-
AIGC从入门到实战:落霞与孤鹜齐飞:AIGC 汹涌而来
作者:禅与计算机程序设计艺术 Generative Capacity (AIGC has taken the technology world by storm in recent years, bringing forth innovative so...
-
轻松识别Midjourney等AI生成图片,开源GenImage
AIGC时代,人人都可以使用Midjourney、Stable Diffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响,例如,生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈,造成信任危机等。...
-
Midjourney NIJI5制作动漫风格作品保姆级教程
大家好!最近我尝试了好几个与动漫艺术相关的AI绘画平台,发现Midjourney(AIGF)的 Niji 模式绝对是目前最好用的动漫风格生成式 AI 之一! 最让我震惊的是,我们甚至不需要会画画,就能创造出高质量的图像!AI 绘画和Midjourne...
-
AI绘画Stable Diffusion XL 可商用模型!写实艺术时尚摄影级真实感大模型推荐(附模型下载)
大家好,我是设计师阿威 大家在使用AI绘画的时候,是不是遇到这种问题:收藏的模型确实很多,可商用的没几个,而今天阿威将给大家带来的这款写实艺术时尚摄影级真实感大模型-墨幽人造人XL, 对于个人来讲完全是可以进行商业应用滴!根据作者的描述墨幽人造人XL在...
-
五分钟上手IoT小程序
五分钟上手IoT小程序 IoT小程序框架 搭建开发环境 首先安装NodeJs 安装NodeJs 验证安装成功 安装cnpm 安装VSCode 开发IDE 下载开发IDE 安装开发IDE 安装框架脚手架 下载模拟器 创建工程项目 应用...
-
每日AIGC最新进展(11):角色脸妆生成、防止微调Stable Diffusion过拟合的方法、通过 3D Gaussian Splatting 进行特定于说话者的头部说话合成
Diffusion Models专栏文章汇总:入门与实战 Gorgeous: Create Your Desired Character Facial Makeup from Any Ideas https://arxiv.org/abs/2404...
-
专家指出如果 Google 冒险在 AI 功能上加码,就需要明确说明可能出错的地方
在谷歌推出其 AI 概览功能不久后,该功能在页面顶部为一些搜索查询提供 AI 生成的摘要,网络上开始讨论搜索引擎竟然推荐吃胶水披萨或食用石头的荒谬建议。 今年早些时候,Google 在 Gemini 上推出了图像生成工具,但由于聊天机器人错误再现了历史人...
-
Midjourney Imagine API 申请及使用
Midjourney Imagine API 申请及使用 申请流程 要使用 Midjourney Imagine API,首先可以到 Midjourney Imagine API 页面点击「Acquire」按钮,获取请求所需要的凭证: 如果你尚未...
-
重磅!Stable Diffusion 3.0正式开源!史上最强AI绘画模型!(附安装方法和下载地址)
大家好,我是程序员晓晓 正如承诺的那样,Stability AI在6月12日正式开源了Stable Diffusion 3(Medium版本)!不愧是AI生图领域的“开源英雄”。 接下来就讲讲,怎么在本地部署最新的Stable Diffusion...
-
【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents
文章目录 一、前言 (一)DALLE2 简介 (二)DALLE2和DALLE的对比 (三)相关模型推出时间 二、文章概要 (一)标题 (二)摘要 (三)引言 (四)模型架构 三、方法 (一)图像生成的相关工作 (二)diffusion...
-
AIGC中的强化学习技术原理与应用
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
stable diffusion生成图片权限报错,PermissionError: [Errno 13] Permission denied: ‘/tmp/gradio/tmpidsfdagq.png
因为我这边用的是远程服务器,我没有管理员权限,所以网上其他人说的sudo什么的方法对我都没有用,我又去找了其他的方法,在https://blog.csdn.net/wandererXX/article/details/136935596 这篇博客里面说到了...
-
每日AIGC最新进展(23):魁北克人工智能研究所提出扩展注意力机制视频编辑、浙江大学提出video-to-Audio生成算法Frieren、清华大学提出扩散模型参数高效迁移学习Diff-Tuning
Diffusion Models专栏文章汇总:入门与实战 Temporally Consistent Object Editing in Videos using Extended Attention 本文提出了一种用于视频编辑的新方法,旨在通过...