-
AI作画算法详解:原理、应用与未来发展
随着人工智能技术的不断发展,AI作画逐渐成为了一个热门话题。AI作画,即利用人工智能算法生成绘画作品,不仅仅是技术的展示,更是艺术与科技结合的创新体现。本文将深入探讨AI作画的核心算法原理,并通过实例帮助读者更好地理解和掌握这一技术。 文章最后,给大家推...
-
揭秘!FFmpeg+Whisper双剑合璧:解锁视频到文本的二阶段奇迹
解锁视频到文本的二阶段奇迹 一、引言 二、视频音频提取与处理 视频音频提取与处理 2.1 环境搭建 2.2 视频音频提取 2.3 音频预处理 示例代码: 三、语音识别与翻译 3.1 加载Whisper模型 3.2 语音识别 3.3 语言检...
-
AI绘画杀死了设计师!?恰恰相反……
与大多数人想象的不同,ChatGPT等各种AI工具爆火之后,受到冲击最大的居然是设计师、作家、翻译等具有创造性的工作,以体力劳动为主的蓝领反而最不易被替代。 以城市数据团做过的一项研究为例,他们对中国1639种职业进行了GPT替代风险分析,下面是数据...
-
新研究:AI测谎能力比人类更强 但需谨慎使用
快科技7月15日消息,据媒体报道,德国维尔茨堡大学当地时间12日公布的最新研究显示,在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代,人工智能在测谎方面的表现比人类更佳。 这项发表在《iScience》期刊上的研究,精心设计了一场实验:参与者被要求撰...
-
联发科研发AI服务器芯片:最先进的台积电3nm
天玑系列在智能手机领域已经打下一片江山,联发科也在寻求更多突破,除了联合NVIDIA打造PC处理器,还在悄然开发自己的AI服务器芯片。 目前关于联发科服务器芯片的细节还知之甚少,只能确定还是ARM指令集架构,当然这类产品已经不少,但始终没有完全打开局面,服...
-
京东广告研发——AIGC在京东广告创意的技术应用
一、前言 电商广告图片不仅能够抓住消费者的眼球,还可以传递品牌核心价值和故事,建立起与消费者之间的情感联系。然而现有的广告图片大多依赖人工制作,存在效率和成本的限制。尽管最近AIGC技术取得了卓越的进展,但其在广告图片的应用还存在缺乏卖点信息、难以规模...
-
Stable Diffusion 3 ComfyUI基础工作流保姆级详解 | 全网最全SD3解析
引言 Stable Diffusion 3 已经发布!就在 6 月 12 日,Stable Diffusion 3 的媒体模型终于开放下载。虽然在 Web UI 上还没有提供体验可以体验的方式,但我们已经可以通过Comfy UI来尝试最新的 Stable...
-
探索AI写作的深度奥秘:从困惑度到爆发度的挑战与机遇
大家好,今天来聊聊探索AI写作的深度奥秘:从困惑度到爆发度的挑战与机遇,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 探索AI写作的深度奥秘:从困惑度到爆发度的挑战与机遇 在AI技术飞速发展...
-
文心一言、Kimi等4款AI大模型测评对比及推荐(AI大模型训练)
现在,国内已经有海量大模型诞生,那么,哪款大模型的表现会更好?这篇文章里,作者站在自媒体人的角度,对四款大模型做了评估和对比,一起来看一下。 说到AI,很多人会想到ChatGPT,而我们现在也有许多好用的国产AI大模型。 在2023年的中国,8个月...
-
深度解读昇腾CANN模型下沉技术,提升模型调度性能
本文分享自华为云社区《深度解读昇腾CANN模型下沉技术,提升模型调度性能》,作者:昇腾CANN。 AI模型的运行通常情况下需要CPU和NPU(昇腾AI处理器)等AI专用处理器协同工作,CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(De...
-
LLama Factory微调模型全流程,与peft库调用训练的adapter
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 LLama Factory微调流程 一、准备微调的数据集和模型 二、读取模型和数据进行训练 1.使用web ui 2.修改官方脚本(推荐) 第三,加载与推...
-
零代码教你安装部署Stable Diffusion 3,一键生成高质量图像
本文分享自华为云社区《重磅!【支持中文】stable-diffusion-3安装部署教程-SD3 来了》,作者:码上开花_Lancer。 正如承诺的那样,Stability AI在6月12日正式开源了Stable Diffusion 3(Medium版本...
-
AI写作软件:解放创作还是威胁人文?
1. AI写作软件简介 近年,得益于 AI 技术的飞速成长,AI 写作软件渐被众人熟知。AI 写作软件,是一种借助 AI 技术实现文字自动生成的工具,其使用范围广泛,包括新闻写作、广告文本创作、甚至小说写作等各个领域。通过深度学习以及自然语言处理技术,其...
-
AIGC文生图lora微调训练案例;SD-Train界面训练stable Diffusion lora模型
lora仓库(1000多个lora微调模型分享): https://lorastudio.co/models 1、命令代码方式:文生图lora微调训练案例 主要用huggingface相关包:peft、accelerate、diffusers 参...
-
AI日报:谷歌Gemini将发五个新功能;百度推文小言AI数字人社交APP;OpenAI草莓计划揭秘;亚马逊上线Rufus AI购物助手
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、谷歌Gemini即将发布五个新...
-
推荐开源项目:Whisper - 实时语音转文本的利器
推荐开源项目:Whisper - 实时语音转文本的利器 1、项目介绍 Whisper 是一个由 OpenAI 制作的开源项目,它提供了一个强大的工具,能够将音频转换为文本。该项目基于 whisper.cpp 并利用 FFMPEG 进行音频格式转换,可以...
-
Autoclipr有哪些功能免费吗 AI剪辑怎么使用方法详细教程指南
Autoclipr 是什么? Autoclipr是一款使用AI技术从长视频中提取垂直剪辑的工具。它能够自动选择视频中的热门片段,并生成吸引人的垂直剪辑,帮助用户节省时间并扩大观众群体。目前Autoclipr处于Beta测试阶段,提供免费试用。 Aut...
-
AI绘画的救星!手把手教你在ComfyUI玩转局部重绘!
我们在用AI创作图片的时候,通过模型和提示词,让AI有了很大的随意发挥空间,这种随意发挥带来了很多随机性和不确定性,大部分情况下会给我们带来更多的惊喜。但是总会有一些时候,有一些小细节不尽人意 这个时候,我们就需要一个很普通,却很重要的功能——局部重绘...
-
Starry功能介绍及免费使用指南 AI沉浸式双语翻译浏览器下载安装地址
Starry简介 Starry 是一款由 AI 驱动的浏览器,致力于让用户轻松浏览外文网页,消除干扰元素,提供更流畅的浏览体验。它通过双语对照浏览功能,让用户无障碍地浏览互联网外文内容,并在浏览过程中以对照的方式学习外文。AI翻译能力贴近原文表达,摆脱传...
-
超详细的 Stable Diffusion Webui入门教程(一)快速安装与启动
一、前言 使用过 Midjourney 的小伙伴经常会问:怎么精准控制 Midjourney 的图片,或者如何更换图片中局部内容(比如:不改变主题的情况下,更换背景)等等,问题也着实不少。 确实,使用 Midjourney 进行图像生成时,它的随机...
-
LLaMA-Factory在华为显卡上的实验记录
如何判断目前所选择的模型是否支持 LLaMA-Factory/src/llamafactory/data/template.py 在项目的这个地址中会有不同模型的支持模版。 这里用目前我最常用的两个模型举例子 一个是智谱的glm4-9B模型 _regi...
-
AI绘画凉了吗?
上个月忙别的事情去了,回来后发现自媒体上SD(Stable Diffusion)和MJ(Mid Journey)相关的创作和讨论明显少了很多,而且似乎都还是那老一套东西;然后又看到说是妙鸭这类APP的数据也是掉头向下。 不禁怀疑现在AI绘画是不是凉了?为...
-
【AIGC调研系列】InternVL开源多模态模型与GPT-4V的性能对比
InternVL和GPT-4V都是多模态模型,但它们在性能、参数量以及应用领域上有所不同。 InternVL是一个开源的多模态模型,其参数量为60亿,覆盖了图像/视频分类、检索等关键任务,并在32个视觉-语言基准测试中展现了卓越性能[2]。InternV...
-
使用文心一言API接口进行二次创新的实践
随着人工智能技术的不断发展和普及,越来越多的企业和开发者开始关注如何利用这些先进技术为自己的业务或产品带来创新。文心一言作为中国领先的人工智能平台,其API接口为开发者提供了强大的功能支持,使得二次创新变得更为简单和高效。 一、了解文心一言API接口...
-
自定义 LLM:LangChain与文心一言擦出火花
自定义 LLM 自定义 LLM 需要实现以下必要的函数: _call :它需要接受一个字符串、可选的停用词,并返回一个字符串。 它还可以实现第二个可选的函数: _identifying_params :用于帮助打印 LLM 信息。该函数应该返回...
-
【人工智能】一文看懂 LLaMA 2:原理、模型与训练
LLaMA 2(Large Language Model for AI Modeling and Assistance)是近年来广受关注的大规模语言模型之一。它被广泛应用于自然语言处理(NLP)任务,如文本生成、机器翻译和问答系统。本文将深入介绍LLaMA...
-
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
「因果推理」绝对是当前GenAI热潮下的小众领域,但是它有一个大佬级的坚定支持者——Yann LeCun。 他在推特上的日常操作之一,就是炮轰Sora等生成模型,并为自己坚信的因果推理领域摇旗呐喊。 甚至,早在2019年VentureBeat的采访中,他...
-
AI机器人伴侣成美国老年人新宠!美国每年花70万刀,失去爱人的84岁老人重新笑了
【新智元导读】84岁的美国老人Dorothy Elicati在失去结婚65年的丈夫后,每天醒来唯一做的事就是哭泣,直到一个AI机器人的出现。现在,美国会每年花费70万美元,为某些州的老年人免费发放这款机器人。 AI机器人,真是老龄化的未来? 《纽约时报》的...
-
引入 AI 技术后,数据库变成了什么样?
作为数据库技术发展趋势之一,AI 与数据库融合迸发无限潜力,推动着数据管理与分析进入一个全新的时代。当前,一些数据库厂商已经开始融合 AI 技术来增强其数据管理和处理能力,用于自动化的数据库调优、预测性维护、智能查询优化、模式识别以及更高级别的数据分析等方...
-
文心一言使用笔记
目录 让文心一言提炼已有的内容,模仿给出的案例写一段宣传稿 方法 例子 发现写出的内容有瑕疵,如何微调? 比如文心一言介绍的领导不全 如何让文心一言检查语法和表达问题? 如何让文心一言将每个片段用一两句话总结? 为了防止雷同,将某一片段...
-
AI绘画变现之MJ制作表情包(附教程)
前期构思: ●主题:明确表情包的主题,例如快乐或悲伤、卡通人物或的动物等; ●形象:描述表情包中角色的外貌特征,例如发型、着装、配饰等; ●表情和动作:描述角色的表情和动作,例如微笑、大笑、哭泣、生气、难过、眨眼等; ●背景和场景:建议尽量使用白色...
-
Fastgpt接入Whisper本地模型实现语音输入
前言 FastGPT 默认使用了 OpenAI 的 LLM 模型和语音识别模型,如果想要私有化部署的话,可以使用openai 开源模型Whisper。参考文章 《openai 开源模型Whisper语音转文本模型下载使用》 开源项目地址 : 兼容op...
-
第二节:stable diffusion基本界面和操作流程
一.基本界面 二.简单操作 1.选择大模型 webui只是一个执行程序,图形的画风内容很大程度由模型控制,先推荐两个学习的模型,一个是stable diffusion1.4,一个是外网非常受欢迎的二次元风模型,AbyssOra...
-
stable diffusion 的controlNet 安装和使用
stable diffusion 安装controlNet需要先下载扩展 扩展地址 下载了扩展以后,需要下载相应的模型,每个模型大约1.45G,可以按需下载。模型地址 如果下载速度太慢,可以考虑去liblib下载,但是是全量模型liblib 模型下载...
-
ShowMeAI | 字节AIGC模型&工具大清单;AI解梦靠谱吗?AI MV制作手册;一文看懂MoE混合专家大模型;DeepSeek发布全球最强开源MoE模型
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! 1. 字节跳动生成式AI布局:卷到飞起的「App 工厂」这局也有点稳了? 字节最近有点猛啊!出圈的AI产品越来越多,迭代速度肉眼可见的快,「App 工厂」...
-
喜欢画画,这拦不住的啊(Stable Diffusion进阶篇:ComfyUI 高清放大)
大家好我是极客菌!!! 高清放大 在AI绘画中给生成出来的图片通过高清修复或者超分辨率的手段放大尺寸是非常常见的,在之前学习过的WebUI中就有文生图的高清修复(Hi-res fix 、图生图的SD放大(SD Upscale 以及后期处理中的算法放大。...
-
【AI绘画】ComfyUI相见恨晚的提示词插件,简直堪称神器!
大家好我是极客菌!之前我曾介绍过一款专为SD设计的中文提示词插件——prompt-all-in-one,想必使用过的小伙伴们都已经感受到了它的便捷与实用吧。 不过,那款插件是基于webUI版本的,而现在,越来越多的朋友开始探索ComfyUI这一新选择。...
-
AIGC在创意设计中的应用
随着人工智能技术的不断进步,AIGC(人工智能生成内容)已成为创意设计领域的新宠。这种新兴技术以其强大的创作能力和高效的工作效率,正逐渐改变着设计师们的工作方式和创作流程。在这个变革的时代,设计师们纷纷拥抱AIGC,探索其在创意设计中的无限可能。...
-
简述下低代码平台、webGIS、AIGC
一、 低代码开发平台 1. 低代码开发平台介绍 低代码开发平台(LCDP)是一种无需编码或仅需少量代码就可以快速生成应用程序的开发平台。它允许开发人员通过图形化的用户界面,使用拖拽组件和模型驱动的逻辑来创建网页和移动应用程序。这种开发方式大大降低了...
-
AIGC大模型微调与私有化部署的应用及案例
AIGC(人工智能生成内容)大模型与私有化部署的结合,特别适用于需要高度数据隐私和定制化需求的场景。以下是AIGC大模型与私有化部署的应用及具体案例分析: 1. 医疗健康 应用 - 临床决策支持:通过私有化部署大模型对患者数据进行分析,生成个性化的诊...
-
使用 Stable Diffusion 实现一键换衣保姆级教程
第一步:安装 Segment Anything 启动 Stable Diffusion (以下简称:SD 打开 SD WebUI 面板 如下图切换到:扩展Tab页 ->可下载->取消本地化、已安装选项,点击:“加载扩展列表” 按...
-
[AIGC] python遍历以及字符串的切片
以下是一篇关于Python遍历方法和字符串切片的文章,以及一个在LeetCode中的问题进行解释。文章最后会给出解题思路和代码实现。 Python遍历方法与字符串切片入门教程 在Python语言中,我们包含了许多内置的函数和方法令其适合于各种数据处理...
-
Stable Diffusion 有什么推荐的Checkpoint 模型、Lora?
引言 -2k字给讲清楚我最常用的SD模型库、关键词和参数! 2022年末我接触sd的时候,还在为可以用Ai绘画而沾沾自喜,现在玩的风生水起,真的感觉没有白接触。除了chatgpt的出现,Ai绘画无意识这两年来的黑科技,如果你还没接触Ai绘画那么就真ou...
-
OpenAI面临监管部门调查:因涉嫌限制员工举报安全隐患
快科技7月14日消息,据媒体报道,OpenAI因涉嫌使用限制性保密协议 (NDA 限制员工发声而再次受到审查。 据媒体报道,OpenAI被曝强制员工签署所谓的过度限制性”协议,此举严重阻碍了员工揭露公司技术可能带来的潜在风险与危害。 这起事件的导火索是一...
-
How Stable Diffusion was built: Tips and tricks to train large AI models
How's everyone doing? Yay. Thank you for being your last session for us today. I'm sure you're waiting for your beers right now....
-
Llama 3 基于知识库应用实践(一)
一、概述 Llama 3 是Meta最新推出的开源大语言模型,其8B和13B参数的模型的性能与之前的Llama 2相比实现了质的飞跃。以下是官方给出的模型性能评测对比结果(引自:https://ai.meta.com/blog/meta-llama-3/...
-
AI绘画Stable Diffusion 生成智能家电产品效果图,我给AI的 vs AI给我的,AI电商进阶教程!
大家好,我是程序员晓晓 今天给大家分享一下如何用AI绘画制作电商产品海报图,全程干货诚意满满,赶快学起来吧! 图文教程 首先,我们使用的是AI绘画工具 Stable Diffusion(如需要SD的安装包可看我往期入门教程AI绘画专题—Sta...
-
Midjourney基础操作
下载安装 下载注册discord 在探索可发现的服务器中第一个就是midjourney,添加,然后创建一个只有你自己的服务器后添加mj机器人到自己的服务器。具体可以参考 购买midjourney https://www.bilibili.com...
-
AI绘画Stable Diffusion最新版安装部署保姆级教学!Contronet安装 | 常见问题解决
大家好,我是画画的小强 Stable Diffusion是一个可以和MJ(Midjourney)相媲美的AI出图工具,简称SD 它是一个开源的、免费的项目,没有公司在经营,如果你想用,是需要安装到自己电脑上的,用自己的电脑来渲染出图,同时需要很多数据...
-
[AI 大模型] 百度 文心一言
文章目录 [AI 大模型] 百度 文心一言 简介 模型架构 发展 新技术和优势 API 代码示例 [AI 大模型] 百度 文心一言 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DwAIh0...