-
【stable diffusion】:云端部署攻略
本文主要介绍stable diffusion云端产品以及使用步骤 ℹ️整合安装包、模型资源见文末~ megaease cloud(强烈推荐) 优点: 集成了常用大模型和插件、VAE 3080显卡配置,费用大概0.48元/小时,可随时暂停,暂...
-
【全网瞩目】最强文生图模型,Stable Diffusion 3技术报告解禁
12号,终于在Hugging Face上出现了 Stable Diffusion 3 Medium。没错,正如他所承诺的,最强文生图模型真的开源了。而且此次开源不仅是以SD2的比较下性能得到了更好的升级,同时也向我们展示了最前沿的DiT技术——MMDiT。...
-
利用Python与Whisper革新视频翻译:打造高精度字幕翻译流程。
实现流程需要使用以下的工具。 1.python,需要自行安装, 2.python的音视频处理库moviepy安装 pip install moviepy 3.Whisper语音识别,在我之前的文章中有:Whisper语音识别安装教程。 4.文字翻...
-
Midjourney 关键词与案例整理
常用关键词 风格 说明 Tradition Chinese Ink Painting 东方山水画 Japanese Ukiyo-e 浮世绘 Japanese comics/manga 日本漫画风格 s...
-
stable-diffusion 3 体验部署流程(ComfyUI)
环境准备 下载及简介 git clone https://huggingface.co/stabilityai/stable-diffusion-3-medium SD3 checkpoints: sd3_medium_incl_clips.s...
-
图像生成新篇章:Stable Diffusion 3 Medium开源评析
摘要 在数字艺术与人工智能的交汇点上,Stable Diffusion 3(SD3)的开源无疑是一场技术革新的盛宴。就在3月份,我撰写了一篇博文,深入探讨了SD3的技术报告内容与介绍,文章发表在CSDN博客上,https://blog.c...
-
Midjourney NIJI5制作动漫风格作品保姆级教程
大家好!最近我尝试了好几个与动漫艺术相关的AI绘画平台,发现Midjourney(AIGF)的 Niji 模式绝对是目前最好用的动漫风格生成式 AI 之一! 最让我震惊的是,我们甚至不需要会画画,就能创造出高质量的图像!AI 绘画和Midjourne...
-
AI绘画Stable Diffusion 3 正式开源,AI生图格局迎来巨变!(附模型下载)
大家好,我是向阳 就在刚刚,Stable Diffusion 3 Medium 如约而至。 几天前,Stability AI 在社交平台 X 上官宣,SD3 Medium 将在 6 月 12 日正式开源。 这一次,没有跳票,它是真的来了。 20...
-
吴恩达老师开源翻译工作流Agent;阿里巴巴开源无需训练即可使用参考图像编辑图像的工具;Whisper Web 浏览器字幕生成
✨ 1: Translation Agent Translation Agent 吴恩达老师开源翻译工作流Agent Translation Agent 是一个基于反思工作流程的机器翻译系统的Python示范。其主要步骤包括: 使用大语...
-
重磅!Stable Diffusion 3.0正式开源!史上最强AI绘画模型!(附安装方法和下载地址)
大家好,我是程序员晓晓 正如承诺的那样,Stability AI在6月12日正式开源了Stable Diffusion 3(Medium版本)!不愧是AI生图领域的“开源英雄”。 接下来就讲讲,怎么在本地部署最新的Stable Diffusion...
-
终于来啦!Stable Diffusion 3将在6月12日正式开源
6月3日晚,著名开源大模型平台Stability AI的联合首席执行官Christian Laforte,在AMD的产品发布会上宣布,文生图模型 Stable Diffusion 3将于6月12日在Hugging Face开源权重。 本次开源的是Stab...
-
AI图像生成Stable Diffusion 3 Medium完全指南 SD3模型下载使用地址入口
探索Stable Diffusion 3 Medium能为你带来哪些改变 为什么选择Stable Diffusion 3 Medium? Stable Diffusion 3 Medium不仅仅是一款产品——它是一项革命性的技术,致力于提供出色的细节、色彩...
-
AIGC领域又有大动作了!AI视频“黑马”Morph Studio 来袭,1080P高清画质视频免费生成!
起初小编也不知道 Morph Studio,也是从AIGC美少女、AI电影导演 海辛Hyacinth 口中知晓,因为她在2024年刚加入了 Morph Studio公司。 废话不多数,接下来小编则为大家介绍下 Morph Studio 这个初创公司开...
-
AI日报:MJ推模型个性化功能;ComfyUI完成SD3 Medium模型适配;字节上线AI交友“小黄蕉”;微信输入法内测AI功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Midjourney推出模型个...
-
AI生图格局大震!Stable Diffusion 3开源倒计时,2B单机可跑碾压闭源Midjourney
重磅消息!Stable Diffusion3,大概率会在明天开源。距离2月SD3的横空出世,已经过去了4个月。如果此事为真,生图圈子第一个出现开源碾压闭源的奇景!强大的MMDiT全新架构,将彻底改变AI生图的格局。现在,全体AI社区都在翘首以盼。 万众瞩目...
-
干货满满!Stable Diffusion 从入门到精通之提示词手册,免费分享,自学转行,零基础首选!
Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度,文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好。本文从“如何写好提示词”出发,从提示词构成、调整规则和 AIGC辅助工具等角度,对文...
-
在嵌入式处理器Jetson Orin上使用Whisper做语音内容识别(3)
1、简介 Nvidia的GPU+CUDA架构在大算力时代遥遥领先毫无疑问了,其通用的硬件特性使得它不再是以往的“显卡”,算力强大并且支持各种AI,软件生态的应用方式基本可以照搬PC端。相比于特定的核心NPU,它显得更加灵活,系统和显存的共用在带宽上有明显...
-
两种AI 图像生成技术:MidJourney 和 Stable Diffusion
目录 1、MidJourney 1.1 MidJourney基本特点 1.2 MidJourney的玩法教程 2、Stable Diffusion 2.1 Stable Diffusion基本特点: 2.2 Stable Diffusio...
-
国产大模型最近挺猛啊!使用Dify构建企业级GPTs;AI阅读不只是「总结全文」;我的Agent自媒体团队;官方AI绘画课完结啦! | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 大模型近期重大进展:百川、讯飞、智源发布新模型,GLM-4、DeepSeek上线开放平台,Google Bard 反超,Mixtral medium 泄...
-
最强开源大模型Llama 3发布!最大版本是4000亿参数规模!性能直逼GPT-4!
最强开源大模型Llama 3发布!最大版本是4000亿参数规模!性能直逼GPT-4! 当地时间4月18日,Meta 官宣发布其最新开源大模型 Llama 3。目前,Llama 3 已经开放了 80亿 和 700亿 两个小参数版本,上下文窗口为8K。未来...
-
AI绘画Stable Diffusion 【模型推荐】超逼真!专注创造极其真实的人像摄影作品大模型AWPortrait
虽然进入了SD XL时代,但SD1.5中也不乏很多非常优秀的大模型仍在不断地更新中,今天晓晓给大家带了又一款专注于创造极其真实的人像摄影作品的大模型——AWPortrait。 模型下载请看文末扫描获取哦 经过5个月,AWPortrait终于迎来了1....
-
Stable Diffusion老板跑路开新坑,被抛下的SD3开源成了烂摊子
Stability AI前CEO的新公司,终于浮出水面: Schelling AI,就如他当初辞职跑路时所说,致力于“去中心化人工智能系统”。 △图源:?@irfan3 这一消息,由Emad Mostaque本人在最新一次公开亮相中现场宣布。 官网域名s...
-
推荐:Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现
推荐:Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现 项目地址:https://gitcode.com/mustafaaljadery/lightning-whisper-mlx 在...
-
有哪些好的 Stable Diffusion 提示词(Prompt)可以参考?
看完这八种“提示词”种类,你也会Ai高质量出图! 作为一个老法师,Prompt需要我们自己搜集,然后总结。很多人习惯于通过教程和模型来学习绘画,沿着别人预设的轨道前行,这样一开始没有错,但是长久缺乏自主思考和创造的能力,机械式的学习方式只会限制个人的表达...
-
Midjourney 参数详解(MJ参数)
官方地址: Midjourney Parameter ListParameters are added to a prompt to change how an image generates. Parameters can change an imag...
-
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。 最新致歉推文,由Siddharth Sharma(悉达多)和Aksh Garg(阿克什)发出。 不在其中、来自南加利福尼亚大学的M...
-
一模一样!斯坦福AI团队被曝抄袭中国国产大模型:直接删库跑路
快科技6月3日消息,近日,斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。 斯坦福的Llama3-V项目在5月29日发布,宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Cl...
-
AI日报:SD 3宣布开源;中文语音AI天花板ChatTTS官网上线;Veo支持单图生成视频;ElevenLabs推多样化AI音频模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、抖音:将打击使用AI技术P图侮...
-
OpenAI声称挫败了俄罗斯、以色列等国的“舆论黑客”
近日,因安全团队核心人员离职而深陷信任危机的OpenAI发布了最新的安全报告,宣称在过去三个月中挫败了五个利用ChatGPT操控舆论的黑客组织APT行动(舆论黑客)。 OpenAI将操控舆论的影响力活动(IO)定义为“试图以欺骗的方式操纵舆论或影响政治...
-
Stability AI开源SD 3:6月12日可下载 不可商用
Stability AI 的联合首席执行官正式宣布了 Stable Diffusion 3 Medium 的开放发布日期为6月12日。这一消息让许多期待使用这一模型的人欣喜不已。 Stable Diffusion3Medium 是Stability AI...
-
AI绘画动漫转真人详细教程
从小到大,我们看过的动漫、玩过的游戏有很多很多 但我们会发现里面的角色或者人物都是二次元的 我就会好奇这些动漫人物在现实中会长什么样 而现在,我们通过AI绘画竟然就能还原出来他们现实中的样子 除了动漫角色和游戏人物,古代的画像、经典...
-
AI绘画SD入门教程:文生图基础用法(提示词)
大家好,我是程序员晓晓 今天我们来实践一下,通过提示词(prompt)的输入,让SD生成我们满意的图片。在生成图片前,我们先了解下提示词的基础原则,有了这些知识能迅速帮助各位同学构建出自己的提示词。 !基本原则! 首先,我来介绍下写提示词的基本原...
-
x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别
介绍 Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。 INFO: whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库,是基于 OpenAI 的 Whisper 模型的移植版本,旨在通过深度...
-
OpenAI 开源的免费 AI 语音转文字工具 - Whisper,一步一步本地部署运行
Whisper 是 OpenAI 研发的一个通用的语音识别模型,可以把语音转为文本。它在大量多样化的音频数据集上进行训练,同时还是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 一、使用场景 语音 => 文字 是一个非常实用的功能,...
-
使用自己的数据集训练DETR模型
众所周知,Transformer已经席卷深度学习领域。Transformer架构最初在NLP领域取得了突破性成果,尤其是在机器翻译和语言模型中,其自注意力机制允许模型处理序列数据的全局依赖性。随之,研究者开始探索如何将这种架构应用于计算机视觉任务,特别是...
-
微软发布Phi-3 Vision等最新大模型系列
微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...
-
微软发布Copilot智能体 还带来了本机小语言模型
5月22日消息,当地时间周二,微软在Build开发者大会上发布Copilot新智能体,它就像虚拟员工一样,能自动执行任务。微软认为,这种人工智能将消除枯燥乏味的工作内容,而不是完全取代员工工作。 此外,微软还针对Copilot+ PC推出了本机小语言模...
-
Gabby World V2:融合AI和区块链技术的全新龙与地下城风格游戏问世
站长之家(ChinaZ.com)5月22日 消息:在全新的Gabby World V2游戏中,玩家将迎来一个融合了人工智能和区块链技术的独特体验。这款创新游戏以Dungeons & Dragons为灵感,为玩家提供了创建和探索故事的机会,打造了完全...
-
微软Copilot+PC之后还有大招!牵手GPT-4o后能力简直王炸!奥特曼也来build现场了!
编辑|伊风 出品 | 51CTO技术栈(微信号:blog51cto) 昨天,微软震撼发布的Copilot+PC,被大赞终于是真正的AI PC了! 今天,在AI领域里拳打谷歌,脚踢苹果的微软又在build大会中狠狠地秀了一把肌肉。宣布要将Windows打造...
-
替代MLP的KAN,被开源项目扩展到卷积了
本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。 KAN 在准确性和可解释性方面表现优于 MLP,而且它能以非常少的参数量胜过以更大参数量运行的 MLP。比如,作者表示,他们用 KAN 以更小的网络和更高的自动化...
-
Llama-3的竞争对手来了——可运行在iPhone上的小体量高性能LLM模型Phi-3
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 熟悉我的文章的读者可能还记得我以前报道《课本就是你所需要的一切》(https://medium.com/@mgunton7/th...
-
量化、剪枝、蒸馏,这些大模型黑话到底说了些啥?
量化、剪枝、蒸馏,如果你经常关注大语言模型,一定会看到这几个词,单看这几个字,我们很难理解它们都干了些什么,但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们,理解其中的原理。 模型压缩 量化、剪枝、蒸馏,其实是通用的神经网络...
-
微软3.8B模型媲美GPT-3.5!小到用iPhone就能跑起来,网友:Good data is all you need!
撰文、整理 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 这周,“小模型”之战打得可谓精彩非凡,让人目不暇接。前脚,小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...
-
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama 3发布刚几天,微软就出手截胡了? 刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。 其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。 为了方便开源社区使用,还特意设计成了与Llama系列兼容的结...
-
微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位
近日,微软推出了一款名为Phi-3系列的小型AI模型,该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型,仅拥有3.8B参数,却在多项基准测试中超越了拥有8B参数的Llama3模型。 微软特别强调,经过4bit量化处理的Phi-3-...
-
Llama3突然来袭!开源社区再次沸腾:GPT4级模型自由访问时代到来
Llama 3来了! 就在刚刚,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。 并且推出即为开源SOTA: Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。 8B模型在MMLU、GPQA、Huma...
-
六种方式快速体验最新发布的 Llama 3!
昨晚, Meta 发布了 Llama 3 8B 和 70B 模型,Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,Gemma 7B 和 Mistral 7B。 Llama 3 模型将...
-
whisper-large-v3:速度快的令人翻译模型三种实用的调用方法
1、whisper-large-v3 是openai公司的模型,可使用Python代码调用; 2、whisper-large-v3基础上chenxwh 制作了开源库insanely-fast-whisper ,可本地指令运行,或 Google Colab...
-
Stable Diffusion 如何写好提示词(Prompt)
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 本文深入探讨了如何撰写出优质的提示词,内容涵盖多个维度:提示词的多样化分类、模型应用中的经典提示词案例、提供丰富资源的提示词参考网站、便捷高效的提示词生成工具,以及...
-
AI语音识别神器Openai Whisper对中文的支持如何?
文章目录 前言 一、资料准备 二、Whisper环境搭建 第一步:安装whisper 第二步:安装ffmpeg 三、Whisper测试 总结 其他相关 前言 语音识别一直以来都是人工智能领域中一个不容忽视的技术,随着大模型时...