-
【喂饭级AI教程】手把手教你在本机安装Stable Diffusion秋包【附带全套资源】
今天,我们将探索一个为Bilibili社区核心贡献者秋叶大佬所发布的神器——一款整合软件包。这款软件巧妙地简化了学习Python和网络知识这一通常漫长的过程。即使是编程新手,也能轻松入门并开始使用Stable Diffusion(简称SD),并且几乎不需要...
-
AI绘画:使用Stable Diffusion ComfyUI进行换脸:IPAdapter FaceID全面教程
在数字艺术和媒体编辑领域,换脸技术已经成为一种流行且强大的工具。它允许创作者将一个人物的面部特征无缝地转移到另一个人物上,创造出令人信服的视觉作品。Stable Diffusion ComfyUI提供了一个高效的平台,让用户能够轻松地实现换...
-
详解各种LLM系列|LLaMA 2模型架构、 预训练、SFT内容详解 (PART1)
作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/670002922 大家好,这里是 NewBeeNLP。之前我们分享了详解各种LLM系列|...
-
一文速览Llama 3及其微调:从如何把长度扩展到100万到如何微调Llama3 8B
前言 4.19日凌晨正准备睡觉时,突然审稿项目组的文弱同学说:Meta发布Llama 3系列大语言模型了,一查,还真是 本文以大模型开发者的视角,基于Meta官方博客的介绍:Introducing Meta Llama 3: The most capa...
-
Midjourney从入门到实战:Midjourney制作电影级镜头体验(附prompts)_ai绘画制作的电影视觉特效
?Midjourney是目前主流的一款AI生成图像工具,它风格多样,细节丰富,创作自由,涵盖文生图、图生图、图图结合等模式。对于艺术创作者来说,它可以扩展能力、提高效率,增加创意;对于大众爱好者来说,没有任何美术基础也可以进行艺术创作!本专栏详细介绍了Mi...
-
最新ChatGPT4.0工具使用教程:GPTs使用,Midjourney绘画,AI换脸,Suno-AI音乐生成大模型一站式系统使用教程
一、前言 ChatGPT3.5、GPT4.0、相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以和用户进行创作交流。 然而,GPT-4对普通用户来说都是需要额外付费才可以使用...
-
普通人在电脑上尝鲜AI技术的三种方式
TechWeb 文 / 新喀鸦 随着科技的飞速发展,人工智能(AI)已经不再是遥不可及的未来科技,而是逐步融入我们生活的各个角落。从智能家居的便捷操控,到线上服务的智能推荐,再到医疗、教育等行业的深度应用,AI正以其独特的魅力改变着世界。然而,对于许多普通...
-
Google Bard的Gemini Pro最新升级;Nomic Embed: 开源文本嵌入模型
? AI新闻 ? Google Bard的Gemini Pro最新升级 摘要:Bard现在可以在超过40种语言和230多个国家和地区使用Gemini Pro,提供更强大的理解、推理、总结和编码能力。 Bard的双重检查功能将扩展到40多种语言,用户...
-
OpenAI 开源的免费 AI 语音转文字工具 - Whisper,一步一步本地部署运行
Whisper 是 OpenAI 研发的一个通用的语音识别模型,可以把语音转为文本。它在大量多样化的音频数据集上进行训练,同时还是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 一、使用场景 语音 => 文字 是一个非常实用的功能,...
-
详解生成式人工智能的开发过程
译者 | 晶颜 审校 | 重楼 开发生成式人工智能应用程序与开发传统的机器学习应用程序非常不同,以下是步骤详解。 回到机器学习的“古老”时代,在您可以使用大型语言模型(LLM 作为调优模型的基础之前,您基本上必须在所有数据上训练每个可能的机器学习模型,...
-
AI绘画进阶工具ComfyUI 傻瓜整合包安装教程!模型共享,一键安装!
哈喽大家好,今天给大家分享一下AI绘画工具Stable Diffusion的另一种UI界面,常见的有: 窗口式界面的WebUI 节点式工作流的ComfyUI ComfyUI更加进阶一些,是一个节点式工作流的AI绘画界面,它高度可定制、自定义编辑Ai生...
-
数据驱动与 LLM 微调:打造 E2E 任务型对话 Agent
作者 | Thought Agent 社区 在对话系统的设计和实现中,传统的基于 Rasa-like 框架的方法往往需要依赖于多个模块的紧密协作,例如我们在之前的文章中提到的基于大模型(LLM)构建的任务型对话 Agent,Thought Agent,其...
-
现在可以用GPT-4O 自动生成 Figma 设计稿了
近期,由GPT-4o提供支持的技术能够根据产品需求文档(PRD)自动生成Figma设计稿。这一技术主要针对移动端应用进行优化,支持使用高质量的设计系统,如Ant Design Mobile和Arco Mobile。 该技术支持将PRD解析为特定的数据格式...
-
ai写作软件推荐哪个?选这6个让写作变得简单又高效
转眼间已到了四月中旬,部分大学生们还在为毕业论文犯愁。 选题、构思、撰写,每一步都充满了挑战与困扰。时间紧迫、思路枯竭、文笔不济……这些问题成了许多毕业生心中的“拦路虎”,让人望而生畏。 别担心!今天来给大家安利6款超好用的AI写作生成软件,让它们...
-
2500页算法文档泄露!搜索史上最强黑箱曝光,谷歌翻车再升级?
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 谷歌有点流年不利。 前两天刚被曝出,其搜索新推出的“AI 摘要(AI Overviews)”功能经常提供严重错误的搜索结果信息,例如,荒唐地建议用户用胶水来防止披萨上的奶酪滑落...
-
微软、亚马逊、IBM 承诺公布 AI 模型的安全措施
在首尔举行的 AI 安全峰会上,微软、亚马逊和 IBM 等领先科技公司承诺在开发基础模型时公布他们所采取的安全措施。这些公司都同意,如果无法控制或减轻 AI 模型所带来的风险,将不会开发或部署该模型。 图源备注:图片由AI生成,图片授权服务商Midjou...
-
Stable Diffusion初级教程
一、入门篇 1. 理解基本概念 扩散模型(Diffusion Models):扩散模型是一种生成模型,通过逐步添加噪声到数据样本中,然后学习如何逐步去除这些噪声来恢复原始数据。 Latent Diffusion Model (LDM :LDM是...
-
一年心血被毁,OpenAI超级对齐负责人愤而出走Anthropic!Ilya去向依旧成谜
OpenAI超级对齐团队负责人Jan Leike,在前不久愤而宣布辞职后,刚刚公布了自己的新去向——入职Anthropic。 Anthropic,俨然已经成为OpenAI离职人员的「避难所」,OpenAI价值观对立面的大本营。 Jan Leike开心表示...
-
AI工程师薪酬远超其他同行!入门级平均超170万元
快科技5月29日消息,根据Levels.fyi发布的2024年第一季度AI工程师薪酬调查数据,人工智能(AI)工程师的薪酬远超非AI软件工程师。 调查结果表明,不同级别的AI工程师薪酬普遍高于非AI工程师。具体来看,入门级AI工程师的平均薪酬为239000...
-
OpenAI Whisper 语音转文本实验
为了实现语音方式与大语言模型的对话,需要使用语音识别(Voice2Text)和语音输出(Text2Voice)。感觉这项技术已比较成熟了,国内也有许多的机构开发这项技术,但是像寻找一个方便测试的技术居然还不容易。Google 墙了,微...
-
Meta AI的首席执行官LeCun:不要从事LLM工作
出品 | 51CTO技术栈(微信号:blog51cto) 在巴黎举行的初创企业年度技术大会VivaTech上,Meta AI的首席执行官Yann LeCun建议希望在AI生态系统中工作的学生不要从事LLM(大型语言模型)方面的工作。 “如果你是对构建下一...
-
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练
大神Karpathy已经不满足于用C语言造Llama了! 他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。 挑战成功本身并不意外,但是只花费20美元、90分钟完成训练,Loss和评测还超越原版,就!有!点!过!分!了!。 不仅如此,...
-
Meta Llama 3本地部署
感谢阅读 环境安装 收尾 环境安装 项目文件 下载完后在根目录进入命令终端(windows下cmd、linux下终端、conda的话activate) 运行 pip install -e . 不要控制台,因为还要下载模型。这...
-
GPT-5倒计时!奥特曼踢走Ilya得逞,宫斗惊人内幕再曝光
「OpenAI下一代前沿模型,正在训练中」。 经历了几周前Ilya、安全团队负责人Jan Leike离职后,超级对齐团队也被OpenAI解散。 今天,奥特曼领衔的OpenAI全新的「安全与保障委员会」官宣成立。 不仅如此,OpenAI预计,正在训练的下...
-
研究发现:OpenAI 的 GPT-4 在金融分析领域具有 “相对优势”:
根据芝加哥大学布斯商学院的一项研究,OpenAI 的 GPT-4在金融分析和预测方面超越了人类分析师,即使没有行业特定信息。这项研究上周公布,发现 GPT-4这一大型语言模型在分析财务报表和预测未来收益方面表现出色。研究称:“即使没有任何叙述或行业特定信息...
-
SD(Stable Diffusion) 简易教程
最近给家里的小朋友用 SD(Stable Diffusion 生成卡通头像,顺便记录一下 SD 的基础使用教程。 教程目录 SD 安装与部署 认识模型和插件 基础使用教程 SD 安装与部署 SD 安装和部署可以分为本地和云端。本...
-
谷歌搜索算法内幕被扒,2500页巨细文件实名泄密!搜索排名谎言被揭穿
日前,谷歌2500页的内部文档被泄露,揭示了搜索——「互联网最强大的仲裁者」的运作方式。 爆料人是SparkToro的联合创始人兼CEO,他在自家网站上发表博客文章,宣称「一位匿名人士与我分享了数千页泄露的谷歌搜索API文档,SEO中的每个人都应该看到它...
-
Khoj:一个开源的个人化AI助手 轻松连接本地与在线文档
Khoj 是一个功能丰富、开源的个人化AI助手,旨在帮助用户管理和检索各种信息源,同时提供多种智能功能以提升工作效率。 以下是Khoj的主要特点、功能及应用场景: 主要特点 多源信息获取:能够连接本地和在线文档,包括PDF、Markdown文件、Git...
-
【ollama】(2):在linux搭建环境,编译ollama代码,测试qwen大模型,本地运行速度飞快,本质上是对llama.cpp 项目封装
关于 ollama 项目 https://github.com/ollama/ollama/tree/main/docs https://www.bilibili.com/video/BV1oS421w7aM/ 【ollama】(2...
-
LlamaIndex:如何为大模型加载一个AI知识库?
大模型被喻为人类正在经历的一场科技革命,而横亘在大模型和实际业务场景之间的,是大模型在面对企业复杂业务场景时解决问题的能力,要具备这样的能力,数据是关键。 这其中需要的数据,不是通用大模型训练时用到的那些常见数据,而是与企业业务相关的数据,这些数据是大...
-
商汤日日新大模型5.0粤语版发布 定价30港元1M tokens
商汤科技正式发布了全新的“日日新大模型5.0粤语版”。这一版本不仅定价亲民,以30港元的价格提供1M tokens(输入与输出均同价)的优质服务,而且支持最大128K窗口,确保用户在使用过程中获得流畅、高效的体验。 此外,“商量粤语版”还将推出网页版和Ap...
-
手把手教你基于华为云,实现MindSpore模型训练
本文分享自华为云社区《【昇腾开发全流程】MindSpore华为云模型训练》,作者:沉迷sk。 前言 学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。 并打通一个Ascend910训练到Ascend310推理的全流程...
-
AIGC重塑金融:AI大模型驱动的金融变革与实践,2024年最新阿里面试二面
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。 深知大多数HarmonyOS鸿蒙开发工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不...
-
奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了
在联合创始人、首席科学家 Ilya Sutskever 官宣离职、超级对齐团队被解散之后,OpenAI 研究的安全性一直备受质疑。 现在,OpenAI 董事会宣布成立新的安全与保障委员会,由董事 Bret Taylor(董事会主席)、Adam D’Ang...
-
AI日报:GPT-4o可自动生成Figma设计稿;视频换衣被I2VEdit搞定了;抖音“AI证件照”特效爆火;和GPT4玩狼人杀,人类因太蠢出局
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、又炸!GPT-4o可自动生成F...
-
当前都在堆长窗口,还需要 RAG 吗?
自从谷歌的 Gemini 1.5 Pro 发布后,行业内就有不少人在背后“蛐蛐” RAG。 一方面是因为,Gemini 的表现确实亮眼。根据官方发布的技术报告,Gemini 1.5 Pro 能够稳定处理高达100 token,相当于1小时的视频、11小时...
-
通俗易懂的Stable Diffusion模型结构介绍
目录 SD的发展历程 SD 模型的网络结构 ClipText 文本编码器 文本向量输入Unet VAE模型 总结图 SD的发展历程 Stab...
-
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
如今,想训个SOTA的大模型,不仅缺数据和算力,甚至连电都不够用了。 最近马斯克就公开表示,因为苦于买不到足够的芯片,xAI只能推迟Gork 2的训练和发布。 Grok 3及更高版本,甚至需要10万个H100,按每台H100售价3万美元来算,仅芯片就要花...
-
和GPT4等大模型玩狼人杀 人类因讲话没深度被3票出局
最近,一位昵称为「Tore Knabe」的网友在X平台发布的一段视频引发了人们的讨论。视频中,四个AI NPC与一个人类坐在一起,按照“乘务员”的要求互相试探,找出其中隐藏的人类。每个NPC都对应着一款大模型,而五位扮演者分别被赋予了一个历史知名人物作为角...
-
Stable Diffusion基础:ControlNet之重新上色(黑白照片换新颜)
本文给大家分享 Stable Diffusion 的基础能力:ControlNet 之重新上色。 这是一个最近新上的 ControlNet 模型,它可以识别图像中的不同区域,并使用不同的颜色重新绘制它们。 安装 ControlNet 安装 工欲善其...
-
Gartner 问卷调查结果:仅少部分组织具备成熟的人工智能流程
分析机构 Gartner 的最新问卷调查报告显示,人工智能的使用正在业界企业迅速普及。然而大多数受访企业承认自己企业的人工智能流程并不成熟。 该调查基于对 644 家组织的问卷访问,结果发现受访者的组织在多个业务流程中应用人工智能的比例从 2021 年...
-
OpenAI正训练GPT-4的继任者,GPT-5或将带来三个重大升级
虽然 OpenAI 最近推出的模型 GPT-4o 在大型语言模型(LLM)领域有了重大突破,但该公司已经开始着手研发下一个旗舰模型 GPT-5。许多人在 GPT-4o 发布前期就期待着 OpenAI 推出备受瞩目的 GPT-5。为了澄清这种猜测,首席执行官...
-
利用AI秒去水印,移除不想要的内容|【Stable Diffusion】实战篇
最近有老铁询问如何将图片中不想要的内容去掉,当然你可以用PS来操作,但是这可能会占用你不少时间。今天我给大家介绍一款SD插件,可以秒去要移除的内容,并且效果上来看还是很不错的。它就是——cleaner插件。 插件和模型地址文末获取~ 插件快速安装...
-
AGI渐行渐近,该加速还是要踩刹车?
人类距离第一个AGI的出现已经越来越近了! 马斯克在今年早些时候预测,AGI可能会在2026年投入使用。DeepMind联合创始人、首席AGI科学家Shane Legg在一次访谈中认为,2028年,人类有50%的概率开发出第一个AGI。然而百度CEO李...
-
OpenAI 首席执行官 Sam Altman 承诺捐出大部分财富
OpenAI CEO Sam Altman 宣布加入 “捐赠誓约” 名单,承诺捐赠超过一半的财富,这一决定是在 Altman 经历了一段动荡的时期后做出的。 图源备注:图片由AI生成,图片授权服务商Midjourney 作为总部位于旧金山的公司 Chat...
-
AI丨部署SadTalker并添加到Stable Diffusion
前言 Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。 如何配置Stable Diffusion部署本地A...
-
ChatGPT成知名度最高生成式AI产品,使用频率却不高
本文经AIGC开放社区公众号授权转载,转载请联系出处。 想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 5月29日,牛津大学、路透社新闻研究所联合发布了一份生成式AI(AIGC)...
-
和GPT-4这些大模型玩狼人杀,人类因太蠢被票死,真·反向图灵测试
「你看,人类一败涂地了」 这是一次「反向图灵测试」,几个全球最先进的大模型坐在一起,坐着火车唱着歌,但其中混进了人类: 而 AI 的任务,是把这个人类揪出来。 最近,一位昵称「Tore Knabe」的网友在 X 平台发布的一段视频引发了人们的讨论。在视频中...
-
AI日报|微软推出Copilot+PC,通义主模型大幅降价,文心两大模型全面免费...
文章推荐 AI晚报|GPT-4o最新语音交互模式即将上线,微软Build 2024开发者大会即将开幕... AI Agent深度解析:潜力与挑战并存的智能新世界 GPT-4o重磅发布,第一时间用户测评,OpenAI也存在夸张宣传? 微软让Windo...
-
自动驾驶系统架构转变思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 自动驾驶系统架构转变思考 从事辅助驾驶系统架构一段时间后,感觉到了疲惫和无力感,更加深刻的理解到道德经,道生于有,有生于无,有无相生,难易相承,.....是以圣人处无为之事,行不言之教,万物作焉而不辞...