-
小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用
比赛?:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 报名赛事(点击即可跳转 (一定要进行报名,后面环境中的数据和授权等会用到) 赛事链接:https://tianchi.aliyun.com/competit...
-
FLUX 1 将像 Stable Diffusion 一样完整支持ControlNet组件
之前 InstantX 团队做的多合一的 Flux ControlNet 现在开始和 ShakkerAI 合作并推出了:Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro 该模型支持 7 种控制模式,包括 canny...
-
使用OpenAI Whisper的说话人识别管道
使用OpenAI Whisper的说话人识别管道 whisper-diarizationAutomatic Speech Recognition with Speaker Diarization based on OpenAI Whisper项目地址:...
-
大模型之二十七-语音识别Whisper实例浅析
Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其...
-
AIGC 与 ChatGPT 的区别与联系
前言 在人工智能技术飞速发展的今天,生成式人工智能内容(AIGC)和对话式 AI(如 ChatGPT)成为了备受瞩目的话题。虽然这两者在技术基础和应用领域上有很多重叠之处,但它们也各自有独特的特点和用途。本文将深入探讨 AIGC 与 ChatGPT 的...
-
Distil-Whisper 开源项目教程
Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...
-
探营万平外滩大会科技展:体验AI助手、脑机接口、超写实数字人
2024Inclusion·外滩大会将于明天正式开幕。9月4日,站长之家小编来到大会现场探营,今年围绕科技、人文、可持续三大关键词再次升级,特设10000平方米的科技展览和3000平方米的绿色生活节,为观众带来一场活色生香的沉浸式科技体验。 万平米的科技...
-
如何在家用设备上运行 Llama 3.1 405B?搭建 AI 集群
在开放式 LLM 模型和封闭式 LLM 模型之间的竞争中,开放式模型的最大优势是您可以在本地运行它们。除了电力和硬件成本外,您无需依赖外部提供商或支付任何额外费用。但是,随着模型大小的增加,这种优势开始减弱。运行需要大量内存的大型模型并不容易。幸运的是,张...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
OpenAI宣布启动GPT Next计划:AI性能有望提高100倍
快科技9月4日消息,日前,OpenAI Japan出席了KDDI峰会,介绍了公司即将推出的下一代AI模型,并宣布将在2024年启动GPT Next计划。 OpenAI Japan首席执行官长崎忠雄(Tadao Nagasaki)长崎忠雄在峰会上强调了AI技...
-
深入解读Midjourney的起源和发展历程
深入解读Midjourney的起源和发展历程 1.背景介绍 1.1 人工智能时代的到来 随着计算机技术和算力的不断提升,人工智能(AI 技术正在迅速发展,并逐渐渗透到我们生活的方方面面。在这个新兴的AI时代,各种创新应用层出不穷,其中一个备受瞩目的领...
-
《Llama 3大模型》技术报告中英文版,95页pdf
现代人工智能(AI)系统由基础模型驱动。本文介绍了一套新的基础模型,称为Llama 3。它是一群本地支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个具有4050亿参数和高达128K令牌上下文窗口的密集Transformer。本文对Llama...
-
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南 stable-diffusion-webui-Prompt_Generator项目地址:https://gitcode.com/gh_mirrors/st/...
-
【AI绘画】ComfyUI 入门教程:安装 ComfyUI,AIGC新手入门教程
大家好,我是写编程的木木。 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样: C...
-
Mac 部署Stable Diffusion WebUI和ControlNet的保姆级教程(附安装包)
Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述生成详细图像,它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。详细介绍看维基百科词条Stable Diffusi...
-
Stable Diffusion绘画 | ControlNet应用-Lineart(线稿):轻轻松松画线稿
Lineart(线稿 专门用来提取线稿的算法。 适合对漫画图片进行提取线稿: 不同的预处理器: lineart_standard:适合各种类型的画面 lineart_realistic:适合用于真人图片的线稿提取 lineart_coar...
-
LLM之基于llama-index部署本地embedding与GLM-4模型并初步搭建RAG(其他大模型也可,附上ollma方式运行)
前言 日常没空,留着以后写 llama-index简介 官网:https://docs.llamaindex.ai/en/stable/ 简介也没空,以后再写 注:先说明,随着官方的变动,代码也可能变动,大家运行不起来,可以进官网查查资料...
-
AI日报:ComfyUI0.2.0全新版本发布;混合现实插画模型FLUX.1-dev-LoRA;Playground V3生图模型发布
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、全新ComfyUI 0.2.0...
-
Datewhale AI夏令营第四期 AIGC方向Task1笔记
①文生图基基础知识: ✔提示词:主体描述,细节描述,修饰词,艺术风格,艺术家 ✔Lora模型:实现对特定主题、风格或任务的精细化控制 ✔ComfyUI:模型微调、数据预处理、图像生成 ✔参考图控制:openp...
-
MIT新研究揭秘「AI洗脑术」!AI聊天诱导人类「编造」记忆,真假难辨
【新智元导读】MIT研究发现:在AI的操纵下,人类会被植入虚假记忆!36.4%的参与者会被聊天机器人误导,形成「现场有枪」的错误记忆。有趣的是,AI的阿谀奉承,会产生「回音室效应」,让偏见更加强化。 GenAI的影响,已经不仅仅是搜索引擎、聊天机器人这么简...
-
利用Streamlit前端框架开发Stable Diffusion模型图像生成网页应用(下篇)
今天介绍亚马逊云科技推出的国际前沿人工智能模型平台Amazon Bedrock上的Stability Diffusion模型开发生成式AI图像生成应用!本系列共有3篇,在上篇中我们学习了如何在亚马逊云科技控制台上体验该模型的每个特色功能,如文生图、图生图、...
-
Stable Diffusion | AI生成室内设计全流程,10分钟一张效果图!再也不用苦苦找装修公司了!
大家好我是安琪!!! 在数字化时代的浪潮中,艺术与科技的融合正以前所未有的速度重塑着我们的创意世界。室内设计,这一曾几何时更多依赖于设计师手绘草图与空间想象的领域,如今正被人工智能(AI)的浪潮深刻影响着。AI绘画技术,作为这一融合趋势的璀璨明珠,正逐步成...
-
交出成绩单,前8个月AI移动应用收入20亿美元
2024年已经来到了9月份,AI 依然是各界最关心的话题之一,坏消息是,在大家心里真正能跑通 PMF 的产品依然还只有那几个,但好消息是,越来越多厂商的入局在推动产业前进,即便很多产品可能还无法跑正、真正实现盈利,但越来越多新产品出现在用户视野范围之内,并...
-
实测小红书AI声聊,一种适合年轻人体质的发疯社交?
小红书又点亮了一块AI拼图。 最近,小红书悄咪咪上线了一个“AI声聊”功能:一种更适合年轻人体质的“发疯”聊天方式。 你可以在小红书群里赛博刻碟、爆改流行歌曲,或者化身动漫/影视/游戏CV玩角色扮演。 入口就藏在小红书群聊底部输入框的+号里: AI声聊...
-
他在淘宝开了个AI店铺,投入几百就能月入过万?
昨天朋友给我发了一个店铺,说有人用AI在淘宝做一个很奇特的业务,有点猎奇,但是又非常稳定的月入过万。 就是用AI生成还没出生的宝宝长相。 你只要把你在医院拍的宝宝的四维彩超图,发给店家,然后店家用AI模型生成一张"未来宝宝照",给你看看你的宝宝生下来以后长...
-
专用于理解游戏场景的开源大模型-VideoGameBunny
大模型在游戏开发领域扮演了重要角色,从AI机器人生成到场景搭建覆盖各个领域。但在游戏场景理解、图像识别、内容描述方面很差。 为了解决这些难题,加拿大阿尔伯塔的研究人员专门开源了一款针对游戏领域的大模型VideoGameBunny(以下简称“VGB”)。 V...
-
AI助力浮雕创作!万物皆可浮雕?Stable Diffusion AI绘画【浮雕艺术】之文生浮雕!
前言 对于浮雕艺术,其实并不了解。但有幸能和“细辛”前辈结识,对浮雕有了简单的了解,浮雕图案的传统方式是先由画师画出图,然后由雕刻师雕刻。画师画图归为浮雕的设计阶段,画师会绘制出浮雕的设计图,这为后续的雕刻工作提供了基础和指导。设计图可以展现出...
-
探索Midjourney:AI图像创作的操作指南及通元软件在高校领域的实际应用
引言 大家好,今天我要介绍一款在设计与艺术领域中备受瞩目的 AI 图像创作工具 —— Midjourney。本文将讲解 Midjourney 如何在国内环境下应用,帮助读者顺利使用该工具进行创意图像生成的方法。此外,我还会介绍通元软件如何...
-
AI日报:Claude 3.5 Sonnet不免费了;海螺AI上线音乐和视频生成;360AI 助手推出模型竞技场
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Claude 3.5 Sonn...
-
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记)
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记) 00. Diffusion 扩散模型 去噪扩散模型(Denoising diffusion probabilistic models,DDPM) 正向扩散过程 逆向去噪过程...
-
快讯 | Midjourney开拓硬件领域:苹果前经理加盟助力发展
硅纪元快讯栏目,每日追踪AI领域的最新动态,快速汇总最新科技新闻,助您时刻紧跟行业趋势。简明扼要的呈现资讯概要,让您快速了解前沿资讯。 1分钟速览新闻 Claude AI 聊天机器人性能下滑引争议 中国能源化工行业首个330亿参数昆仑大...
-
Claude认出自画像,惊现自我意识!工程师多轮测试,实锤AI已过图灵测试?
Claude又通过「图灵测试」了?一位工程师通过多轮测试发现,Claude能够认出自画像,让网友惊掉下巴。 最近,Anthropic提示工程师「Zack Witten」惊奇地发现,Claude居然能认出自己的自画像? 是的,它能认出自己,但这并不是故事的全...
-
5 分钟 Stable Diffusion 本地安装指南
一、Stable Diffusion 简介 Stable Diffusion 是一款非常强大的基于深度学习的 AI 图像生成技术。它由众多研究团队和开发者共同努力而成,其中包括德国慕尼黑大学和总部位于纽约的 RunwayML 公司的国际研究团队。...
-
艺术与科技的融合:探索AI绘画工具的领军者
随着近年来数据、算法等核心技术的不断进步,人工智能在内容创作各垂直领域的比例不断增加,包括人工智能写作、人工智能编辑和最近流行的人工智能绘画。人工智能绘画让用户体验到智能的便利,并获得了很多创作的乐趣。因此,许多朋友也想跟上潮流,使用人工智能绘画生成软件创...
-
OpenAI家庭机器人NEO登场,动作丝滑逼近人类!穿着西装的「人」却专做家务
【新智元导读】OpenAI支持的明星初创1X Technologies,发布了最新的通用家务机器人NEO。不仅外形自然拟人,还有仿生设计带来的丝滑动作。不想干的家务,真的可以让机器人帮忙了! 继Optimus和擎天柱之后,人形机器人领域又闯入一员猛将。 O...
-
SD三分钟入门!秋叶大佬24年8月最新的Stable Diffusion整合包V4.9.7来了~
1 什么是 Stable Diffusion? Stable Diffusion(简称SD)是一种生成式人工智能技术,于2022年推出。它主要用于根据文本描述生成精细图像,同时也可应用于其他任务,如图像修补、扩展,以及在文本提示下进行图像到图...
-
在 iPhone 15 Pro 上运行 Llama-3.1 8B;使用扩散模型生成类人绘画过程的工具;使用ChatGPT自动生成思维导图
✨ 1: MLX Examples 在 iPhone 15 Pro 上运行 Llama-3.1 8B 基于 MLX 机器学习推理框架轻松将 「Llama-3.1 8B」在 iPhone 15 Pro 上运行? 代码已开源! 地址:http...
-
AIGC从入门到实战:AIGC 在传媒行业的创新场景—人机协同创作,推动传媒向智媒转变
AIGC从入门到实战:AIGC 在传媒行业的创新场景—人机协同创作,推动传媒向智媒转变 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词: 人工智能生成内容(AIGC)、传媒行业...
-
使用Llama 私有化模型检索文档回答问题
部署 Llama 模型 Llama 属于文字生成模型,可以用于聊天。使用 Ollama 部署 Llama 模型,先安装 Ollama sudo curl -L https://ollama.com/download/ollama-linux-amd64...
-
Llama-X 开源项目指南
Llama-X 开源项目指南 Llama-XOpen Academic Research on Improving LLaMA to SOTA LLM项目地址:https://gitcode.com/gh_mirrors/ll/Llama-X 项目...
-
逼真到被打假!OpenAI投的机器人身穿衣服做家务,被怀疑人类套壳拍视频
微软和OpenAI投资的人形机器人公司,又上新了! 来自挪威的机器人公司1X Technologies,发布了全新一代家务机器人NEO的原型。 不同于那些只有机械骨骼的钢铁巨兽,NEO穿上了人类一样的衣服,看上去更像人了。 NEO专为居家场景而打造,手部...
-
Stable Diffusion模型训练:从数据准备到模型优化
Stable Diffusion模型训练:从数据准备到模型优化 开篇引入:探索创意无限的Stable Diffusion 数据集构建秘籍:打造专属训练素材 如何收集高质量图像数据? 数据预处理小技巧:清洗与标注 模型配置与训练实战:让创意流...
-
AIGC的第一次尝试#有奖赛事#Datawhale X 魔搭 AI夏令营
目录 挑战赛内容 挑战赛奖励 实践过程 Step 1(获得免费的Linux云计算主机) Step 2(配置训练环境) 成品展示 总结 一、任务概述 二、学习收获 三、反思与展望 拓展 提示词 常见训练参数 一键AI生成图片体验...
-
OpenAI大逃亡,AGI安全团队半数出走!奥特曼:攘外必先安内
尽管不断招兵买马,依旧挡不住OpenAI的安全团队「集体出走」。半数员工已离职、公司处在风口浪尖,奥特曼却在此时选择对内部员工展开安全监控。 今年5月发布会后,安全团队负责人Ilya Sutskever和Jan Leike曾前后脚在推特上官宣离职。 加入...
-
使用 Ollama、Llama 3.1 和 Milvus 进行函数调用案例
偶然看到一篇很短代码就能实现llama function call的文章。 秉着学习加分项的原则,进行了实验测试。这里给出案例和全部改写后的代码。 将 LLM 与函数调用相结合,就如同赋予您的 AI 连接世界的能力。通过将您的 LLM 与外部工具(例如用...
-
Chinese-Llama-2-7b 开源项目教程
Chinese-Llama-2-7b 开源项目教程 Chinese-Llama-2-7b开源社区第一个能下载、能运行的中文 LLaMA2 模型!项目地址:https://gitcode.com/gh_mirrors/ch/Chinese-Llama-2...
-
ComfyUI安装中文(汉化)
打开页面-右下角Manager-Custom Nodes Manager 搜索关键字 AIGODLIKE 安装AIGODLIKE-TRANSLATION-COMFYUI 安装完成以后会提示重启,如果点击重启以...
-
AIGC文生图 Task01#Datawhale X 魔搭AI夏令营
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。以下是笔者对Task01教程的一些记录。 30min速通指...
-
【AI绘画】Midjourney前置指令/describe、/shorten详解
文章目录 ?前言 ?Midjourney前置指令/describe 使用方法 1️⃣2️⃣3️⃣4️⃣(选择对应提示词生成图片) ?(重新识别生成一组提示词) ?Imagine all(一次性生成所有提示词对应的图片) 注意 ?Midjou...
-
写作灵感干涸?笔灵AI写作工具来拯救,让你的创意泉涌不断
在这个信息爆炸的时代,写作已经成为一项几乎每个人都需要掌握的技能。面对一张空白的纸张,许多人常常感到无从下手。为了解决这一难题,我向大家推荐一款强大的写作辅助工具——笔灵AI写作。它不仅能帮助我们解决写作中的困扰,还能让我们的创作过程变得更加轻松和高效。...