medium 第3页 - AIGC资讯

Omost - 一句话即可AI绘画，自动生成关键词，本地一键整合包

近日，ControlNet的作者推出了一个全新的项目——Omost。这个项目对现有图像模型的提示词理解有着巨大的帮助。通过很短的提示词，就可以生成非常详细并且空间表现很准确的图片。划重点，这个项目需要8G显存显卡运行，据说老显卡，比如10系可能用不了，具体...

生成式AI 2024-06-19 人工智能

1122阅读

AI绘画工具Stable Diffusion【模型篇】：Embedding模型

大家好，我是画画的小强。一. Embedding模型介绍 Embedding可以理解为一堆提示词的集合。它将很多的提示词汇总到一个文件里，我们需要的时候，只需要调用这个Embedding文件，就等同于输入了很多的提示词，对用户来说非常方便。 Emb...

生成式AI 2024-06-19 人工智能

1078阅读

Stable Diffusion【二次元模型】：质量高细节丰富的动漫风格大模型anima_pencil-XL

今天给大家介绍的是一个动漫风格的大模型anima_pencil-XL，这个模型出自一位日本的创作者。最早的版本是V1.0.0是今年1月份才发布的，短短的2个月已经更新了5个版本，最新的版本是V2.6.0，可见作者更新版本的频率有多高。提到anima_p...

人工智能 2024-06-19 人工智能

1036阅读

【stable diffusion】：云端部署攻略

本文主要介绍stable diffusion云端产品以及使用步骤 ℹ️整合安装包、模型资源见文末~ megaease cloud（强烈推荐）优点：集成了常用大模型和插件、VAE 3080显卡配置，费用大概0.48元/小时，可随时暂停，暂...

大数据 2024-06-19 人工智能

931阅读

【全网瞩目】最强文生图模型，Stable Diffusion 3技术报告解禁

12号，终于在Hugging Face上出现了 Stable Diffusion 3 Medium。没错，正如他所承诺的，最强文生图模型真的开源了。而且此次开源不仅是以SD2的比较下性能得到了更好的升级，同时也向我们展示了最前沿的DiT技术——MMDiT。...

生成式AI 2024-06-19 人工智能

1222阅读

利用Python与Whisper革新视频翻译：打造高精度字幕翻译流程。

实现流程需要使用以下的工具。 1.python,需要自行安装， 2.python的音视频处理库moviepy安装 pip install moviepy 3.Whisper语音识别，在我之前的文章中有：Whisper语音识别安装教程。 4.文字翻...

人工智能 2024-06-18 人工智能

1187阅读

Midjourney 关键词与案例整理

常用关键词风格说明 Tradition Chinese Ink Painting 东方山水画 Japanese Ukiyo-e 浮世绘 Japanese comics/manga 日本漫画风格 s...

生成式AI 2024-06-18 人工智能

1121阅读

stable-diffusion 3 体验部署流程（ComfyUI)

环境准备下载及简介 git clone https://huggingface.co/stabilityai/stable-diffusion-3-medium SD3 checkpoints： sd3_medium_incl_clips.s...

大数据 2024-06-17 人工智能

1445阅读

图像生成新篇章：Stable Diffusion 3 Medium开源评析

摘要在数字艺术与人工智能的交汇点上，Stable Diffusion 3（SD3）的开源无疑是一场技术革新的盛宴。就在3月份，我撰写了一篇博文，深入探讨了SD3的技术报告内容与介绍，文章发表在CSDN博客上，https://blog.c...

生成式AI 2024-06-17 人工智能

813阅读

Midjourney NIJI5制作动漫风格作品保姆级教程

大家好！最近我尝试了好几个与动漫艺术相关的AI绘画平台，发现Midjourney（AIGF）的 Niji 模式绝对是目前最好用的动漫风格生成式 AI 之一！最让我震惊的是，我们甚至不需要会画画，就能创造出高质量的图像！AI 绘画和Midjourne...

生成式AI 2024-06-16 人工智能

1501阅读

AI绘画Stable Diffusion 3 正式开源，AI生图格局迎来巨变！（附模型下载）

大家好，我是向阳就在刚刚，Stable Diffusion 3 Medium 如约而至。几天前，Stability AI 在社交平台 X 上官宣，SD3 Medium 将在 6 月 12 日正式开源。这一次，没有跳票，它是真的来了。 20...

人工智能 2024-06-16 人工智能

1003阅读

吴恩达老师开源翻译工作流Agent；阿里巴巴开源无需训练即可使用参考图像编辑图像的工具；Whisper Web 浏览器字幕生成

✨ 1: Translation Agent Translation Agent 吴恩达老师开源翻译工作流Agent Translation Agent 是一个基于反思工作流程的机器翻译系统的Python示范。其主要步骤包括：使用大语...

AIGC 2024-06-16 人工智能

982阅读

重磅！Stable Diffusion 3.0正式开源！史上最强AI绘画模型！（附安装方法和下载地址）

大家好，我是程序员晓晓正如承诺的那样，Stability AI在6月12日正式开源了Stable Diffusion 3（Medium版本）！不愧是AI生图领域的“开源英雄”。接下来就讲讲，怎么在本地部署最新的Stable Diffusion...

人工智能 2024-06-15 人工智能

2269阅读

终于来啦！Stable Diffusion 3将在6月12日正式开源

6月3日晚，著名开源大模型平台Stability AI的联合首席执行官Christian Laforte，在AMD的产品发布会上宣布，文生图模型 Stable Diffusion 3将于6月12日在Hugging Face开源权重。本次开源的是Stab...

大数据 2024-06-13 人工智能

828阅读

AI图像生成Stable Diffusion 3 Medium完全指南 SD3模型下载使用地址入口

探索Stable Diffusion 3 Medium能为你带来哪些改变为什么选择Stable Diffusion 3 Medium？ Stable Diffusion 3 Medium不仅仅是一款产品——它是一项革命性的技术，致力于提供出色的细节、色彩...

人工智能 2024-06-13 人工智能

871阅读

AIGC领域又有大动作了！AI视频“黑马”Morph Studio 来袭，1080P高清画质视频免费生成！

起初小编也不知道 Morph Studio，也是从AIGC美少女、AI电影导演海辛Hyacinth 口中知晓，因为她在2024年刚加入了 Morph Studio公司。废话不多数，接下来小编则为大家介绍下 Morph Studio 这个初创公司开...

大数据 2024-06-12 人工智能

992阅读

AI日报：MJ推模型个性化功能；ComfyUI完成SD3 Medium模型适配；字节上线AI交友“小黄蕉”；微信输入法内测AI功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Midjourney推出模型个...

生成式AI 2024-06-12 人工智能

919阅读

AI生图格局大震！Stable Diffusion 3开源倒计时，2B单机可跑碾压闭源Midjourney

重磅消息!Stable Diffusion3，大概率会在明天开源。距离2月SD3的横空出世，已经过去了4个月。如果此事为真，生图圈子第一个出现开源碾压闭源的奇景!强大的MMDiT全新架构，将彻底改变AI生图的格局。现在，全体AI社区都在翘首以盼。万众瞩目...

大数据 2024-06-12 人工智能

825阅读

干货满满！Stable Diffusion 从入门到精通之提示词手册，免费分享，自学转行，零基础首选！

Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度，文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好。本文从“如何写好提示词”出发，从提示词构成、调整规则和 AIGC辅助工具等角度，对文...

人工智能 2024-06-12 人工智能

1118阅读

在嵌入式处理器Jetson Orin上使用Whisper做语音内容识别（3）

1、简介 Nvidia的GPU+CUDA架构在大算力时代遥遥领先毫无疑问了，其通用的硬件特性使得它不再是以往的“显卡”，算力强大并且支持各种AI，软件生态的应用方式基本可以照搬PC端。相比于特定的核心NPU，它显得更加灵活，系统和显存的共用在带宽上有明显...

生成式AI 2024-06-11 人工智能

1826阅读

两种AI 图像生成技术：MidJourney 和 Stable Diffusion

目录 1、MidJourney 1.1 MidJourney基本特点 1.2 MidJourney的玩法教程 2、Stable Diffusion 2.1 Stable Diffusion基本特点： 2.2 Stable Diffusio...

大数据 2024-06-11 人工智能

1397阅读

国产大模型最近挺猛啊！使用Dify构建企业级GPTs；AI阅读不只是「总结全文」；我的Agent自媒体团队；官方AI绘画课完结啦！ | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 大模型近期重大进展：百川、讯飞、智源发布新模型，GLM-4、DeepSeek上线开放平台，Google Bard 反超，Mixtral medium 泄...

大数据 2024-06-09 人工智能

1486阅读

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！当地时间4月18日，Meta 官宣发布其最新开源大模型 Llama 3。目前，Llama 3 已经开放了 80亿和 700亿两个小参数版本，上下文窗口为8K。未来...

大数据 2024-06-08 人工智能

1304阅读

AI绘画Stable Diffusion 【模型推荐】超逼真！专注创造极其真实的人像摄影作品大模型AWPortrait

虽然进入了SD XL时代，但SD1.5中也不乏很多非常优秀的大模型仍在不断地更新中，今天晓晓给大家带了又一款专注于创造极其真实的人像摄影作品的大模型——AWPortrait。模型下载请看文末扫描获取哦经过5个月，AWPortrait终于迎来了1....

AIGC 2024-06-08 人工智能

1192阅读

Stable Diffusion老板跑路开新坑，被抛下的SD3开源成了烂摊子

Stability AI前CEO的新公司，终于浮出水面： Schelling AI，就如他当初辞职跑路时所说，致力于“去中心化人工智能系统”。 △图源：?@irfan3 这一消息，由Emad Mostaque本人在最新一次公开亮相中现场宣布。官网域名s...

大数据 2024-06-06 人工智能

815阅读

推荐：Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现

推荐：Lightning Whisper MLX —— 专为Apple Silicon优化的闪电般快速的Whisper实现项目地址:https://gitcode.com/mustafaaljadery/lightning-whisper-mlx 在...

生成式AI 2024-06-06 人工智能

1161阅读

有哪些好的 Stable Diffusion 提示词（Prompt）可以参考？

看完这八种“提示词”种类，你也会Ai高质量出图！作为一个老法师，Prompt需要我们自己搜集，然后总结。很多人习惯于通过教程和模型来学习绘画，沿着别人预设的轨道前行，这样一开始没有错，但是长久缺乏自主思考和创造的能力，机械式的学习方式只会限制个人的表达...

生成式AI 2024-06-05 人工智能

2850阅读

Midjourney 参数详解（MJ参数）

官方地址： Midjourney Parameter ListParameters are added to a prompt to change how an image generates. Parameters can change an imag...

生成式AI 2024-06-05 人工智能

1297阅读

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭，其中两位来自斯坦福的本科生还跟另一位作者切割了。最新致歉推文，由Siddharth Sharma（悉达多）和Aksh Garg（阿克什）发出。不在其中、来自南加利福尼亚大学的M...

大数据 2024-06-04 人工智能

824阅读

一模一样！斯坦福AI团队被曝抄袭中国国产大模型：直接删库跑路

快科技6月3日消息，近日，斯坦福AI团队被曝出了抄袭事件，而且抄袭的还是中国国产的大模型成果，模型结构和代码，几乎一模一样。斯坦福的Llama3-V项目在5月29日发布，宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Cl...

大数据 2024-06-03 人工智能

809阅读

AI日报：SD 3宣布开源；中文语音AI天花板ChatTTS官网上线；Veo支持单图生成视频；ElevenLabs推多样化AI音频模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、抖音：将打击使用AI技术P图侮...

人工智能 2024-06-03 人工智能

945阅读

OpenAI声称挫败了俄罗斯、以色列等国的“舆论黑客”

近日，因安全团队核心人员离职而深陷信任危机的OpenAI发布了最新的安全报告，宣称在过去三个月中挫败了五个利用ChatGPT操控舆论的黑客组织APT行动（舆论黑客）。 OpenAI将操控舆论的影响力活动（IO）定义为“试图以欺骗的方式操纵舆论或影响政治...

大数据 2024-06-03 人工智能

822阅读

Stability AI开源SD 3：6月12日可下载不可商用

Stability AI 的联合首席执行官正式宣布了 Stable Diffusion 3 Medium 的开放发布日期为6月12日。这一消息让许多期待使用这一模型的人欣喜不已。 Stable Diffusion3Medium 是Stability AI...

生成式AI 2024-06-03 人工智能

769阅读

AI绘画动漫转真人详细教程

从小到大，我们看过的动漫、玩过的游戏有很多很多但我们会发现里面的角色或者人物都是二次元的我就会好奇这些动漫人物在现实中会长什么样而现在，我们通过AI绘画竟然就能还原出来他们现实中的样子除了动漫角色和游戏人物，古代的画像、经典...

大数据 2024-06-02 人工智能

1653阅读

AI绘画SD入门教程：文生图基础用法（提示词）

大家好，我是程序员晓晓今天我们来实践一下，通过提示词（prompt）的输入，让SD生成我们满意的图片。在生成图片前，我们先了解下提示词的基础原则，有了这些知识能迅速帮助各位同学构建出自己的提示词。！基本原则！首先，我来介绍下写提示词的基本原...

人工智能 2024-05-31 人工智能

2833阅读

x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别

介绍 Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。 INFO: whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库，是基于 OpenAI 的 Whisper 模型的移植版本，旨在通过深度...

AIGC 2024-05-31 人工智能

1013阅读

OpenAI 开源的免费 AI 语音转文字工具 - Whisper，一步一步本地部署运行

Whisper 是 OpenAI 研发的一个通用的语音识别模型，可以把语音转为文本。它在大量多样化的音频数据集上进行训练，同时还是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。一、使用场景语音 => 文字是一个非常实用的功能，...

生成式AI 2024-05-29 人工智能

1937阅读

使用自己的数据集训练DETR模型

众所周知，Transformer已经席卷深度学习领域。Transformer架构最初在NLP领域取得了突破性成果，尤其是在机器翻译和语言模型中，其自注意力机制允许模型处理序列数据的全局依赖性。随之，研究者开始探索如何将这种架构应用于计算机视觉任务，特别是...

人工智能 2024-05-23 人工智能

1804阅读

微软发布Phi-3 Vision等最新大模型系列

微软发布了其最新的大型语言模型系列，Phi-3，包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美，同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...

AIGC 2024-05-22 人工智能

794阅读

微软发布Copilot智能体还带来了本机小语言模型

5月22日消息，当地时间周二，微软在Build开发者大会上发布Copilot新智能体，它就像虚拟员工一样，能自动执行任务。微软认为，这种人工智能将消除枯燥乏味的工作内容，而不是完全取代员工工作。此外，微软还针对Copilot+ PC推出了本机小语言模...

人工智能 2024-05-22 人工智能

852阅读

Gabby World V2:融合AI和区块链技术的全新龙与地下城风格游戏问世

站长之家（ChinaZ.com）5月22日消息:在全新的Gabby World V2游戏中，玩家将迎来一个融合了人工智能和区块链技术的独特体验。这款创新游戏以Dungeons & Dragons为灵感，为玩家提供了创建和探索故事的机会，打造了完全...

大数据 2024-05-22 人工智能

864阅读

微软Copilot+PC之后还有大招！牵手GPT-4o后能力简直王炸！奥特曼也来build现场了！

编辑|伊风出品 | 51CTO技术栈（微信号：blog51cto）昨天，微软震撼发布的Copilot+PC，被大赞终于是真正的AI PC了！今天，在AI领域里拳打谷歌，脚踢苹果的微软又在build大会中狠狠地秀了一把肌肉。宣布要将Windows打造...

AIGC 2024-05-22 人工智能

800阅读

替代MLP的KAN，被开源项目扩展到卷积了

本月初，来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。 KAN 在准确性和可解释性方面表现优于 MLP，而且它能以非常少的参数量胜过以更大参数量运行的 MLP。比如，作者表示，他们用 KAN 以更小的网络和更高的自动化...

大数据 2024-05-20 人工智能

812阅读

Llama-3的竞争对手来了——可运行在iPhone上的小体量高性能LLM模型Phi-3

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介熟悉我的文章的读者可能还记得我以前报道《课本就是你所需要的一切》(https://medium.com/@mgunton7/th...

生成式AI 2024-05-15 人工智能

936阅读

量化、剪枝、蒸馏，这些大模型黑话到底说了些啥？

量化、剪枝、蒸馏，如果你经常关注大语言模型，一定会看到这几个词，单看这几个字，我们很难理解它们都干了些什么，但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们，理解其中的原理。模型压缩量化、剪枝、蒸馏，其实是通用的神经网络...

大数据 2024-04-26 人工智能

903阅读

微软3.8B模型媲美GPT-3.5！小到用iPhone就能跑起来，网友：Good data is all you need!

撰文、整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）这周，“小模型”之战打得可谓精彩非凡，让人目不暇接。前脚，小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...

AIGC 2024-04-24 人工智能

848阅读

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了

Llama 3发布刚几天，微软就出手截胡了？刚刚发布的Phi-3系列小模型技术报告，引起AI圈热议。其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。为了方便开源社区使用，还特意设计成了与Llama系列兼容的结...

AIGC 2024-04-23 人工智能

838阅读

微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列挑战OpenAI地位

近日，微软推出了一款名为Phi-3系列的小型AI模型，该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型，仅拥有3.8B参数，却在多项基准测试中超越了拥有8B参数的Llama3模型。微软特别强调，经过4bit量化处理的Phi-3-...

AIGC 2024-04-23 人工智能

831阅读

Llama3突然来袭！开源社区再次沸腾：GPT4级模型自由访问时代到来

Llama 3来了！就在刚刚，Meta官网上新，官宣了Llama 3 80亿和700亿参数版本。并且推出即为开源SOTA： Meta官方数据显示，Llama 3 8B和70B版本在各自参数规模上超越一众对手。 8B模型在MMLU、GPQA、Huma...

大数据 2024-04-21 人工智能

846阅读

六种方式快速体验最新发布的 Llama 3！

昨晚， Meta 发布了 Llama 3 8B 和 70B 模型，Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化，在常见基准测试中优于许多现有的开源聊天模型。比如，Gemma 7B 和 Mistral 7B。 Llama 3 模型将...

AIGC 2024-04-21 人工智能

1111阅读