-
【AI绘画-stableDiffusion】图片放大;高清修复;重绘幅度调参讲解;SD upscale 放大脚本
总览 文章参考:https://www.bilibili.com/video/BV11m4y12727/?spm_id_from=333.788.recommend_more_video.-1&vd_source=38d6ea3466db371...
-
各家LLM大模型写作能力大比拼【GPT4、ChatGPT、ChatGLM-6B、ChatGLM-130B、文心一言、讯飞星火、Claude+】《人工智能之神经网络的前世今生和未来发展趋势》为标题
禅与计算机程序设计艺术评测结论: GPT4 > ChatGLM-130B > ChatGPT > 讯飞星火 > 文心一言 ~ ChatGLM-6B > Claude+ 文章目录 Prompt: 你...
-
【扩散模型】2、DDPM | 去噪扩散概率模型开山之作
文章目录 数学基础知识 一、背景 二、DDPM 主要过程 2.1 前向扩散过程 2.2 逆向去噪过程 2.3 训练和推理 论文:Denoising Diffusion Probabilistic Models 代码:http...
-
JetBrains 推出新 AI 编码助手,结合多个大型语言模型以实现供应商中立
JetBrains 于当地时间周三发布了一款新的 AI 编码助手,这款助手能够从开发者的集成开发环境(IDE)获取信息,并将其反馈给 AI 软件,以提供编码建议、代码重构和文档支持。这家开发工具公司声称,其 AI 助手是第一个供应商中立的此类产品,因为它使...
-
深度学习实战28-AIGC项目:自动生成定制化的PPT文件
大家好,我是微学AI,今天给大家介绍一下深度学习实战28-AIGC项目:自动生成定制化的PPT文件,AIGC项目是一个基于自然语言处理技术的创新性项目,旨在利用ChatGPT模型生成定制化的PPT文件。该项目主要应用于商务和教育领域,可以帮助用户快速创建具...
-
语言模型:GPT与HuggingFace的应用
本文分享自华为云社区《大语言模型底层原理你都知道吗?大语言模型底层架构之二GPT实现》,作者:码上开花_Lancer 。 受到计算机视觉领域采用ImageNet对模型进行一次预训练,使得模型可以通过海量图像充分学习如何提取特征,然后再根据任务目标进行模型...
-
每个人工智能工程师都应该了解的十大人工智能工具和框架
为了在竞争中保持领先地位,我们在此博客中列出了每位 AI 工程师都应该了解的2023 年最佳 AI 工具,包括 TensorFlow、PyTorch、sci-kit-learn 和 Apache Spark。准备好在2023 年获得最佳AI 工程师认证,...
-
视觉CV-AIGC一周最新技术精选(2023-11)
PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型(LMM)扩...
-
打造AI虚拟数字人,Stable Diffusion+Sadtalker教程
站长笔记 2 个月前 1 1k 如何使用Stable Diffusion整合Sadtalker Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型,它使用了一种叫做潜在扩散模型的生成网络架构,可以在普通的GPU...
-
思维链提出者Jason Wei:关于大模型的6个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研...
-
思维链提出者Jason Wei:关于大模型的六个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI...
-
MIT新创公司Liquid AI融资近4千万美元,希望构建新型液态神经网络人工智能
Liquid AI,一家由MIT孵化的新兴公司,近日成功完成了一轮接近4千万美元的种子轮融资,其目标是构建一种全新类型的人工智能,被称为液态神经网络。这一创新性的技术基于液态神经网络架构,旨在提供更为精简、可解释且动态适应的人工智能系统。 Liquid A...
-
国内AI顶会CPAL论文录用结果放出!共计30篇Oral和60篇Spotlight
大家可能还记得,今年五月份公布的,将由国内大佬马毅和沈向洋牵头办的全新首届AI学术会议CPAL。 这里我们再介绍一下CPAL到底是个什么会,以防有的读者时间太久有遗忘—— CPAL(Conference on Parsimony and Learning...
-
motionface respeak新的aigc视频与音频对口型数字人
在当今的数字化时代,人工智能(AI)正在逐渐渗透到我们生活的方方面面。其中,AI技术在视频制作和处理领域的应用也日益广泛。本文将探讨如何利用AI技术实现视频中人脸与音频同步对口型的方法,旨在进一步丰富视频制作的效果和表现形式。 数字人一件...
-
ControlNet多重控制功能推出,AI绘画进入导演时代!
目录 一、“不会开发游戏的AI工具制作者不是好博士” 二、ControlNet出现的背景 三、什么是ControlNet? 四、「神采 Prome AI」的诞生 五、总结 去年DALLE2,Stable Diffusion等文-图底层大模型发...
-
大模型LLaMA和微调LLaMA
1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens,和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化 与Transf...
-
面向AI开发的六种最重要的编程语言
作者丨FATIH KÜÇÜKKARAKURT 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 在AI开发界,你使用的编程语言很重要。每种语言有其独特的特性。选择合适的语言不是关乎个人偏好的...
-
AI文生视频,会在明年迎来“GPT时刻”
在当下的AI赛道上,AI生文、生图的应用,早已层出不穷,相关的技术,也在不断日新月异。 而与之相比,AI文生视频,却是一个迟迟未被“攻下”的阵地。 抖动、闪现、时长太短,这一系列缺陷,让AI生成的视频只能停留在“图一乐”的层面,很难拿来使用,更不要说提供商...
-
高级勒索软件活动突出了对AI网络防御的需求
Deep Instinct的CIO Carl Froggett在访谈中谈到了2024年预算重点向勒索软件预防技术转变,他预计AI,特别是深度学习,将更多地融入业务流程,自动化工作流,并塑造工作场所体验。 勒索软件攻击的新趋势是什么,企业应该如何使用A...
-
Rain AI vs NVIDIA:奥特曼执掌的OpenAI想改变AI芯片游戏规则?
摆脱昂贵的NVIDIA芯片已经成为AI公司的梦想,就连大名鼎鼎的OpenAI也不例外。OpenAI 董事会开除山姆·奥特曼(Sam Altman)事件爆发不久后,就有消息传出奥特曼曾与许多投资者洽谈,打算募资成立一家新的AI 芯片公司。 如今这件事也有...
-
麦肯锡:银行业每年有望从生成式AI获得2000亿至3400亿美元利润
《麦肯锡》最新文章强调,生成式人工智能(gen AI)在银行业具有巨大的潜在价值,全球范围内可为各产业每年增加2.6万亿至4.4万亿美元的价值。在这其中,银行有望获得年度潜在利润达2000亿至3400亿美元,相当于运营利润的9%至15%。 为了充分利用这一...
-
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models 代码:lllyasviel/ControlNet: Let us control di...
-
【stable diffusion 小白最全详细使用教程+大模型资源】
文章目录 一、前言 二、安装 1.解压后点击启动器运行依赖,然后点击A启动器 2.更新本体和扩展 3.把controlnet1.1放入stable diffusion 中 三、使用界面参数 1.提示词 2.采样和迭代步数 3.修...
-
颠覆Transformer霸权!CMU普林斯顿推Mamba新架构,解决致命bug推理速度暴增5倍
深度学习进入新纪元,Transformer的霸主地位,要被掀翻了? 2017年6月12日横空出世,让NLP直接变天,制霸自然语言领域多年的Transformer,终于要被新的架构打破垄断了。 Transformer虽强大,却有一个致命的bug:核心注意力...
-
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑战者,引起大量关注: Mamba(曼巴,一种蛇),在语...
-
让3D编辑像PS一样简单,新算法GaussianEditor在几分钟内完成3D场景增删改
3D 编辑在游戏和虚拟现实等领域中发挥着至关重要的作用,然而之前的 3D 编辑苦于耗时间长以及可控性差等问题,很难应用到实际场景。近日,南洋理工大学联合清华和商汤提出了一种全新的 3D 编辑算法 GaussianEditor,首次实现了在 2-7 分钟完...
-
“离谱的AI扩图”火了!张张那叫一个出其不意
家人们,真的是要被抖音AI扩图给笑死了—— 主打一个看完让人“意想不到”、“一肚子气”~ 例如一对恩爱情侣的照片在AI扩图前是非常有信仰感的: △素材来源:抖音@快乐野人 但在AI扩图一通“神操作”之下,画风简直是180度大反转: △素材来源:抖音...
-
中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用
“ Meta 开源 LLAMA2 后,国内出现了不少以此为基座模型训练的中文模型,这次我们来看看其中一个不错的中文模型:Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中,比较有名的是Meta的LLAM...
-
生成式对抗网络(GAN)原理推导与网络构建思路
0 引言 设想这样的场景:你是一个工作室的老板,你的工作室主要用来生产名画的赝品;而真正的名画则为前人所创造,存放在收藏室中。你的赝品画会和真品画一起被鉴定家鉴定,而你的终极目标是成为一个以假乱真的工艺大师。通往目标的路自然十分坎坷,你首先要做的就是以...
-
R-CNN作者Ross Girshick离职,何恺明、谢赛宁回归学界,Meta CV走出了多少大神
FAIR 又一位大佬级研究科学家「出走了」,这次是 R-CNN 作者 Ross Girshick。 近日,Meta 首席科学家 Yann LeCun 发推宣布,Ross Girshick 将离开 FAIR,加入艾伦人工智能研究所(AI2)。此前离职的还...
-
不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了
增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模型的参数量已扩展至千亿级别,「大模型」越来越大的趋势还将愈演愈烈。 这种趋势带来了多方面的算力挑战。想要微调参数量达千亿级别的大语言模型,不仅训练时间长,还需占用大量高性能的内存资...
-
ChatGPT:开启AI新纪元-人工智能AI
报告地址:ChatGPT:开启AI新纪元-人工智能AI 随着人工智能技术的不断发展,越来越多的领域开始应用人工智能技术来提高效率和质量。其中,自然语言处理技术的应用尤为广泛,人们使用自然语言处理技术来进行语音识别、机器翻译、文本分类等。而在这些...
-
奥特曼宫斗戏新爆料:自己投芯片公司,让OpenAI签下3.6亿订购意向书
奥特曼又惹上事了。 一份订购意向书曝光,奥特曼任CEO期间,OpenAI承诺从一家初创公司订购芯片,金额高达5100万美元(约合人民币3.6亿元)。 关键问题在于,这家公司Rain AI是奥特曼自己参与投资的。 图片 两家公司总部都在旧金山,相距不到一公...
-
机器学习 - 混淆矩阵:技术与实战全方位解析
本文深入探讨了机器学习中的混淆矩阵概念,包括其数学原理、Python实现,以及在实际应用中的重要性。我们通过一个肺癌诊断的实例来演示如何使用混淆矩阵进行模型评估,并提出了多个独特的技术洞见。文章旨在为读者提供全面而深入的理解,从基础到高级应用。...
-
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见
「矩阵模拟」的世界或许真的存在。模拟人类神经元,不断进化的Transformer模型,一直以来都深不可测。 许多科学家都试着打开这个黑盒,看看究竟是如何工作的。 而现在,大模型的矩阵世界,真的被打开了! 一位软件工程师Brendan Bycroft制作了...
-
21Dak攻击:计算机顶会PLDI‘23 针对语义依附代码模型的对抗攻击方法:Destroyer篡改输入程序,Finder寻找关键特征,Merger关键特征注入【网安AIGC专题11.22】
Discrete Adversarial Attack to Models of Code 写在最前面 一些对关系抽取和事件抽取相关的启发和思考 摘要 总结与展望 课堂讨论 研究背景与意义 对抗攻击 针对代码模型的对抗攻击 Semanti...
-
Meta 首席科学家 Yann LeCun 认为 AI 超级智能不会很快到来,对量子计算持怀疑态度
在 Meta 庆祝其基础 AI 研究团队成立 10 周年的活动中,该公司首席科学家兼深度学习先驱 Yann LeCun 表达了对当前人工智能系统发展的看法。LeCun 认为,现有 AI 系统距离达到某种程度的自我意识,具备推动其能力超越仅仅以创造性方式总结...
-
AI震撼材料学!谷歌DeepMind新研究登Nature,一口气预测220万种新材料
只用一个AI,就获取了人类接近800年才能搞出来的知识成果! 这是谷歌DeepMind新研究的一种材料发现工具,论文已经发表在Nature上。 仅凭这个AI工具,他们发现了220万种理论上稳定的新晶体材料,不仅将预测材料稳定性的准确率从50%拉高到80...
-
深度强化学习:智能机器中的头号玩家
Labs 导读 你是否想象过机器人也可以成为游戏领域的超级高手?是时候让你的幻想成为现实,深度强化学习这位头号玩家来啦!这是一个令人兴奋又神秘的领域,简单来说,它就是让计算机像人类一样学习和玩游戏。深度强化学习的学习过程就像是一场盛大的冒险,只不过主角...
-
AIGC时代,大模型微调如何发挥最大作用?
人工智能的快速发展推动了大模型的广泛应用,它们在语言、视觉、语音等领域的应用效果已经越来越好。但是,训练一个大模型需要巨大的计算资源和时间,为了减少这种资源的浪费,微调已经成为一种流行的技术。微调是指在预训练模型的基础上,通过在小数据集上的训练来适应新的任...
-
Linux 中的机器学习:Whisper——自动语音识别系统
Whisper 是一种自动语音识别 (ASR 系统,使用从网络收集的 680000 小时多语言和多任务数据进行训练,Whisper 由深度学习和神经网络提供支持,是一种基于 PyTorch 构建的自然语言处理系统,这是免费的开源软件。 安装Whisp...
-
今日思考(1) — 算力对机器人的影响(基于文心一言的回答)
目录 1.高tops的算力能支持什么水平的复合机器人控制 2.什么情况下控制机器人需要更高的算力 3.为什么使用人工智能算法,例如深度学习、强化学习等,需要更多的计算资源来实现更精准的决策和控制。 4.将已经训练好的人工智能算法模型,例...
-
我们在职场必备AI课,用AI办公提效和AI绘画商业级别的实战的心得分享
职场中必备的AI课程,其中包括AI办公提效和AI绘画商业级别的实战经验和心得分享。通过学习这门课程,你将了解如何运用人工智能技术来提升办公效率,并使用AI创作出高质量的绘画作品。我们还将提供具体的代码示例和实际操作步骤,帮助你快速上手。 正文: 1....
-
[玩转AIGC]sentencepiece训练一个Tokenizer(标记器)
目录 一、前言 二、安装 三、自己训练一个tokenizer 四、模型运行 五、拓展 六、补充 一、前言 前面我们介绍了一种字符编码方式【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码(一) 这种方式是对一个一个...
-
【人工智能】AI写作能力大比拼:《人工智能的数学基础》写下这本书的目录。
文心一言:《人工智能的数学基础》写下这本书的目录。 《人工智能的数学基础》 第一章 人工智能与数学基础 1.1 人工智能简介 1.2 数学在人工智能中的作用 1.3 本书内容概述 第二章 线性代数基础 2.1 向量与矩阵 2.2 行列式与...
-
Stable Diffusion stable-diffusion-webui ControlNet Lora
Stable Diffusion Stable Diffusion用来文字生成图片,ControlNet就是用来控制构图的,LoRA就是用来控制风格的 。 stable-diffusion-webui 国内加速官网: mirrors / A...
-
为什么多数情况下GPT-3.5比LLaMA 2更便宜?
本文旨在为用户选择合适的开源或闭源语言模型提供指导,以便在不同任务需求下获得更高的性价比。 通过测试比较 LLaMA-2 和 GPT-3.5 的成本和时延,本文作者分别计算了二者的 1000 词元成本,证明在大多数情况下,选择 GPT...
-
解锁机器学习-梯度下降:从技术到实战的全面指南
本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例,本文旨在为读者提供一种直观且实用的视角,以理解这些优化算法的工作原理和应用场景。 关注TechLead...
-
DeepMind 推出 AI 工具 GNoME,号称已发现 220 万种新晶体材料
12 月 1 日消息,谷歌旗下 DeepMind 日前在《自然》期刊上展示了自家 AI 工具 GNoME,并介绍了 AI 在材料科学上的相关应用,据悉,DeepMind 使用 GNoME 发现了 220 万种新晶体,其中有 38 万种晶体属于稳定材料,可...
-
人工智能ai写作系统,ai智能写作机器人
人工智能AI大数据深度:基于伪原创算法,采用神经网络算法,在超过1535000篇文章中进行自动学习、聚合算法进行人工智能的创建,内容语义不变,媒体阿里、腾讯、百度均于日前在百家号内容创作者盛典上推出人工智能创作支撑平台创作大脑。 智能助手可以为人类创作者...