-
AIGC 文生图 DiffSynth-Studio微调lora训练案例
参考: https://github.com/modelscope/DiffSynth-Studio https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/train/kolor...
-
Midjourney提示词-十二生肖唐装系列-1
A little white rat in a soft Chinese Tang Dynasty Chinese costume, super cute, cinematic lighting, intricate filigree design, Pi...
-
超9000颗星,优于GPT-4V!国内开源多模态大模型
国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V2.6。 据悉,MiniCPM-V2.6一共有80亿参数,在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini1.5Pro...
-
FLUX.1 最强AI绘画开源模型,最新本地部署教程
Stable Diffusion 作者之一 Robin Rombach 官宣创业,成立了新公司「Black Forest Labs」(黑森林实验室),并推出了最新文生图模型「FLUX.1」。Black Forest Labs 在 AI 开发方面拥有丰富的经...
-
【AI绘画】Midjourney到底是什么?看完就懂了!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 一、Midjourney 的原理 由 2022 年 3 月,美国一家工作室首次推出一款 AI 制图工具,它就是...
-
阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。 Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。 例如,让一位女生说一段话,然后识别她的年纪或解读她的心情;发布一...
-
一文彻底搞定 RAG、知识库、 Llama-3!!
▼最近直播超级多,预约保你有收获 —1— 使用 Llama-3 搞定 RAG 检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它通过将企业外部知识整合到生成过程中,增强了大语言...
-
Stable Diffusion基本原理通俗讲解
Stable Diffusion是一种基于深度学习的图像生成技术,它属于生成对抗网络(GANs)的一种。简单来说,Stable Diffusion通过训练一个生成器(Generator)和一个判别器(Discriminator),来生成逼真的图像。下面我将...
-
LLaMA-Factory
文章目录 一、关于 LLaMA-Factory 项目特色 性能指标 二、如何使用 1、安装 LLaMA Factory 2、数据准备 3、快速开始 4、LLaMA Board 可视化微调 5、构建 Docker CUDA 用户: 昇腾...
-
跟《经济学人》学英文:2024年08月03日这期 GPT, Claude, Llama? How to tell which AI model is best
GPT, Claude, Llama? How to tell which AI model is best Beware model-makers marking their own homework 原文: When Meta, the p...
-
AI日报:阿里开源最新数学模型Qwen2-Math;豆包上线音乐功能;苹果将推高级AI服务;谷歌机器人挑战巴黎奥运
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里开源最新数学模型Qwen2...
-
OpenAI付费功能免费用!却被网友无情嘲讽
快科技8月9日消息,今天OpenAI宣布,将向免费用户开放其{tag_keyurl_3} 3模型的图片生成功能,但这一决策并未收获预期的好评,反而在网上引发了激烈的讨论和嘲讽。 而最主要的原因,就是用户每天仅可以生成两张图片。 DALL-E 3模型自去年9...
-
Stable Diffusion WebUI从入门到精通——提示词篇
前言 === 第六部分:提示词(Prompt 基本概念 在使用 AI 生成图像或进行自然语言处理任务时,提示词(prompts)是关键的工具。通过正确使用提示词,用户可以引导模型生成所需的内容。本部分将介绍提示词的基本概念、语法以及不同类型提示...
-
从LLaMa 3 技术报告,再看LLM构建过程 ——《带你自学大语言模型》系列(番外)
本系列目录 《带你自学大语言模型》系列部分目录及计划,完整版目录见:带你自学大语言模型系列 —— 前言 第一部分 走进大语言模型(科普向) 第一章 走进大语言模型 1.1 从图灵机到GPT,人工智能经历了什么?——《带你自学大语言模型...
-
stable diffusion插件推荐,(插件已打包)高清【图片换脸】,高清【视频换脸】 一键完成
前言 最近发现一个很不错的sdwebui的插件,不仅能完成图片换脸,还能进行视频换脸,而且效果比之前的 faceid和reactor要好很多,更像更高清,哈哈,废话不多说,直接上干货~ 插件是 easyPhoto,实测效果很不错, 插件介绍...
-
【人工智能】如何选择AI绘画工具?Midjourney VS Stable Diffusion
文章目录 ?如何选择合适的AI绘画工具 个人需求选择 比较工具特点 社区和资源</font> ? Midjourney VS Stable Diffusion:深度对比与剖析 使用费用对比 使用便捷性与系统兼容性对比 开源与闭...
-
小米15蓄势待发!雷军预告小米旗舰将接入谷歌AI大模型
快科技8月8日消息,小米创办人雷军在社交平台上宣布,小米旗舰设备国际版将接入谷歌AI大模型Google Gemini,给用户带来更智能、更直观的使用体验。 据悉,Gemini是谷歌研发的多模态AI大模型,能够识别、理解和操作多种类型的信息。 比如你画个鸭子...
-
【人工智能AIGC技术开发】3.浅谈大话人工智能AIGC:几种AIGC底层技术的代码详解
为了更好地理解AIGC(AI Generated Content,人工智能生成内容)的底层技术,我们将详细介绍几种关键技术。这些技术包括深度学习、生成对抗网络(GANs)、变分自编码器(VAEs)和自回归模型(如Transformer和GPT)。 1....
-
本地部署私人知识库的大模型!Llama 3 + RAG!
在今天的的教程中,我们将打造更加个性化的大模型,可以定制搭载私人知识库的本地大模型! 我们探讨Meta AI 的尖端 Llama 3 语言模型构建强大的检索增强生成 (RAG) 来实现。通过利用 Llama 3 和 RAG 技术的功能,我们将创建一个应用...
-
【AI绘画SD】ComfyUI-神级插件-一键高清放大,不改变原图,只做高清处理!
哈喽大家好,我是设计师阿威 以前介绍的一些AI绘画放大插件都是相当于等比例重绘,这就导致了有些细节部分可能会改变,今天给大家分享一个ComfyUI的插件—ComfyUI-SUPIR,可以不改变原图,只做高清处理。下图是作者的案例效果 1、下载插件...
-
llama_fastertransformer对话问答算法模型
LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进,并用于不同的模型,例如 PaLM。以下是与原始架构的主要区别: 预归一化。为了提高...
-
微星新款27寸显示器上市:2K 180Hz曲面屏、支持AI画面增强
快科技8月8日消息,微星推出了新款27寸显示器MAG 275CQPF,采用一种粗犷和坚韧的设计语言,体现了MAG风格的精髓。 据悉,新款显示器采用了27英寸Rapid VA面板,曲率为1500R,10bit色深(8bit FRC),可视角度为178度(水平...
-
AI日报:类GPT-5新模型将上线?奥特曼发草莓照片引热议;美图发布美图云修Pro版; ComfyUI已支持腾讯混元DiT与Flux模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、奥特曼发草莓图引发猜测暗示Op...
-
奥特曼秀5颗草莓疯狂暗示GPT-5?匿名新模型神秘现身,数学超强!
【新智元导读】奥特曼又来搞事情了!一张5颗草莓照片,让全网掀起热议狂澜。这不是明摆着暗示,神秘Strawberry项目真实存在。难道GPT-5真的要来了吗? 或许,GPT-5真的不远了。 今天,Sam Altman突然发文「我爱花园里的夏天」,并配图5颗草...
-
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了?? 权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉: 特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者...
-
AI产品在海外偷摸赚钱,正在变更难
“我们与之前的服务商合作了一年多一直很稳定,但是这几天对方突然停掉了我们的支付。给到的原因是,他们服务的另一家 AI 产品有不符合风控政策的地方,他们作为服务商被信用卡组织罚了10万美元,因为怕产生更多风险,直接停掉了与我们的合作。” 思源解释道。 支付...
-
文心一言 VS 讯飞星火 VS chatgpt (317)-- 算法导论22.3 9题
九、请给出如下猜想的一个反例:如果有向图G包含一条从结点u到结点v的路径,则任何对图G的深度优先搜索都将导致v.d⩽u.f。如果要写代码,请用go语言。 文心一言: 首先,我们需要澄清问题中的几个关键点。在图的深度优先搜索(DFS)中,u.d 通常...
-
Llama-2 vs. Llama-3:利用微型基准测试(井字游戏)评估大模型
编者按: 如何更好地评估和比较不同版本的大语言模型?传统的学术基准测试固然重要,但往往难以全面反映模型在实际应用场景中的表现。在此背景下,本文作者别出心裁,通过让 Llama-2 和 Llama-3 模型进行井字游戏对决,为我们提供了一个新颖而有趣的模型评...
-
Stable Diffusion提示词只看这一篇就够了
一、Stable Diffusion概述 Stable Diffusion是一种基于扩散模型的图像生成技术,广泛应用于AI绘画领域。通过合理使用提示词,用户可以精确控制生成图像的内容和风格。 本文将详细讲解Stable Diffusion的提示词语...
-
开源模型也能强过闭源?Llama 3.1-405B数值对标GPT4!
Llama 3.1-405B引起AI浪潮:开源模型也能强过闭源? Llama 3.1 就这几天,只要你有在关注AI相关的事,你就会看见一群人在讨论 Meta 新出的 Llama 3.1。外网无数的业内大佬都在为之疯狂,因为 Llama3...
-
Stable Diffusion教程|练丹师是如何炼丹的Lora模型训练
前言 还记得我们之前就讲过学习SD成为炼丹师不?那么今天就来手把手教大家炼丹,看看同一个角色或某种风格的小模型是如何制作出来的。 目录 1 炼丹介绍 2 环境准备 3 Lora模型训练 **一、**炼丹介绍 什么是炼丹? 早在学习SD地第...
-
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【新智元导读】科学家正在通过AI的力量,改变乳腺癌的现状。 在全球范围内,每年有超过60万名女性因乳腺癌而无法存活。 美国有八分之一的女性一生中会被诊断出患有乳腺癌。 这些数字听起来很可怕,但并非毫无希望。 当处于最早的局部阶段时,5年相对生存率为99%...
-
Stable Diffusion【应用篇】【艺术写真】:AI写真看过来,使用IP-Adapter-FaceId插件实现AI写真
目前换脸插件有很多,比较典型的有Roop,ReActor,IP-Adapter,InstantID,今天我们来看看使用IP-Adapter-FaceId插件实现AI写真的制作方法。 一. IP-Adapter新模型的下载 插件下载地址(文末扫码也可获取...
-
从科幻到现实:AIGC助力打造个性化数字人
文章目录 一、技术基础:多领域技术的深度融合 1.先进的人工智能技术: 2.实时交互与反馈机制: 3.个性化定制技术: 二、打造策略:从设计到实施的全方位考量 1.深入理解用户需求: 2.精细化设计与开发: 3.持续优化与迭代: 三、未...
-
Gary Marcus:生成式AI泡沫将退,神经符号AI才是未来
近日,人类神经科学和人工智能交叉领域的学者Gary Marcus发文,对生成式人工智能的未来做出了大胆预测:在接下来的12个月内,当前围绕生成式人工智能的泡沫将会破裂。他认为,“生成式人工智能最根本的缺陷在于其可靠性问题”,系统仍会产生幻觉进而生成虚假信息...
-
阿里国际推出首个专业版AI Search,为什么它会是下一个B2B谷歌?
经历过「千模大战」的喧嚣,一年半之后,生成式 AI 的应用层创新终于步入爆发期。 年初的 Sora 激起一阵 AI + 视频生成的浪潮。涟漪未散,OpenAI 新的 SearchGPT 又燃起了 AI + 搜索的战火。 AI + 搜索,这其实是生成式 AI...
-
stable diffusion中的UNet2DConditionModel代码解读
UNet2DConditionModel总体结构图片来自于 https://zhuanlan.zhihu.com/p/635204519 stable diffusion 运行unet部分的代码。 noise_pred = self.unet(...
-
AI绘画进阶工具 ComfyUI 新版来啦!操作界面详解!取消悬浮面板,自带工作流管理功能!(附安装包)
大家好,我是画画的小强 在 7 月初的一次更新中,ComfyUI 官方推出了 Beta 版 UI,取消了原本的悬浮面板,还新增了工作流管理功能,整体使用体验比之前好了很多。今天就为大家详细介绍一些新版 UI 的特点和用法。 一、启用方式 如果想启用...
-
iPhone 16将于今年秋季发布 没有预装AI功能
据行业资深编辑透露,iPhone 16系列将于今年秋季如期发布。根据曝光的信息,这款手机将没有预装AI功能。 苹果公司需要很长时间才能完善AI体验,因此iPhone 16系列出厂时不会搭载Apple Intelligence。虽然苹果CEO库克曾表示该功...
-
AI日报:智谱开源清影同源“兄弟”CogVideoX;阿里通义App推出角色扮演功能;即梦视频生成推动效画板功能;OpenAI领导层大动荡!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、智谱AI宣布开源「清影」同源视...
-
智谱AI刚刚把他们的Sora「清影」,正式开源了,我爱他们。
大半夜的,大洋对岸不卷,国内公司卷起来了。 我真的想睡觉,真的。 起因是我睡觉之前,在看Github的时候,无意间看到THUKEG这个号,更新了一个项目。 CogVideoX。 网址在此:https://github.com/THUDM/CogVideo...
-
做AI转录,拿下日本、实现千万美金ARR
不久前,A16z AI 合伙人Olivia Moore分享了一张 AI 转录初创公司图谱,面向企业服务(B2B)的转录公司不仅数量多,更涉及人宠医疗、招聘、销售和会议等多元场景。其中作为“打工人刚需”的会议场景转录,参与厂商众多,我们也从中发现了一家非常有...
-
AIGC专栏14——ComfyUI秋叶包+EasyAnimate 本地快速拉起
AIGC专栏14——ComfyUI秋叶包+EasyAnimate 本地快速拉起 学习前言 什么是ComfyUI 相关地址汇总 ComfyUI秋叶整合包下载地址 EasyAnimateV3下载地址 操作流程 下载与解压 权重下载 打开Com...
-
每日AIGC最新进展(48):腾讯提出Rich-Contextual Conditional Diffusion Models、OPPO提出自动生成复杂字形海报模型、南京大学提出基于Mamba插帧模型
Diffusion Models专栏文章汇总:入门与实战 Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models...
-
AI工具,还未给短剧开光
诚然,每一次爱,都是在往时间和命运这对强盗手中交付一个人质,可是谁又会因此放弃爱呢?——《遥远地球之歌》 早期AI视频测试中,AI短剧导演赵康(化名)无意中发现了可灵的bug,“文生图生成出来有一种快手风”。彼时,他脑海中只有一句话:“老铁,上链接”。 A...
-
AI绘画工具 Paints-Undo | 告别AI标签,超强的模拟人类笔触式作画,AI绘画新境界!
大家好,我是设计师阿威 今天要给大家带来一个超级酷炫的黑科技——“Paints-Undo”。这不仅仅是一个工具,更是数字艺术创作的一次革命。想象一下,如果你有一张图片,无论是随手一拍的街景,还是精心绘制的草图,"Paints-Undo"都能让它瞬间变成一...
-
降低论文引用率 智能写作
大家好,今天来聊聊降低论文引用率 智能写作,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:降低论文引用率:七个实用技巧助你轻松应对 在学术研究领域,引用他人的研究成果是不可避免的。然而...
-
AI日报:阿里推可控版sora;Google Gemini API大降价;小米15系列全面升级为AI系统;Remini称下载次数最多AI应用
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、媲美Perplexity!Mi...
-
最强大模型 Llama 3.1-405B 架构设计剖析
—1— 最强大模型 Llama 3.1-405B 简介 在历经了两天的提前“泄露风波”后,Llama 3.1 终于正式揭开面纱,由官方对外公布。 新版 Llama 3.1 将其上下文处理能力扩展至 128K,推出了 8B、70B 及 405B 三个不...
-
现在的AI公司们,已经在把用户当“数据提款机”了。
最近,AI公司跟用户之间的冲突与矛盾,变的越来越多越来越大了。 因为一个大家可能从来不看的东西: 用户协议。 最近X(也就是以前的推特)和马斯克,就被这玩意,推上了风口浪尖。 原因是,X被发现“光明正大”的拿用户的帖子来训练Grok AI。 就是马斯克自己...