-
【AI作图】从零开始部署安装Stable Diffusion 2 WebUI【个人总结】
前言 前两天突然想搭建一个AI作图的,但是一脸懵逼,lgithub地址,结果全英也看不懂,只知道了Stable Diffusion,这两天去了解了下,想要网页版就Stable Diffusion WebUI,在自己笔记本上尝试搭建,找了各种...
-
什么值得买CTO王云峰:已组建约 50 人大模型自研团队
什么值得买 CTO 王云峰透露,公司已组建了大约50人的模型自研团队,其中有20人负责数据相关工作,另外30人负责模型、算法、产品构建等方面的工作。公司近期推出的对话式机器人 “小值” 能够提供口碑总结、商品对比、商品推荐、全网比价等服务。用户可以在 “什...
-
AMD显卡继续学习NVIDIA:终于补上AI缩放
快科技3月5日消息,众所周知,AMD显卡经常跟在NVIDIA后边学习先进技术,现在看起来,FSR超分辨率缩放技术经过三代的进化之后,终于要借鉴NVIDIA的方式,也引入AI。 DLSS、FSR、XeSS是当今三大显卡厂商各自提出的超分方案,但实现方式各有不...
-
Claude3给GPT4上了一课!Open AI最强对手深夜炸弹,附全图解析!
出品 | 51CTO技术栈(微信号:blog51cto) 深夜,OpenAI最强对手Anthropic一口气发布了三个SOTA新品,其中包括:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。业界惊呼:Clau...
-
OpenAI、微软、英伟达…AI巨头牵手养育的Figure,是一家怎样的公司?
撰稿|伊风 出品 | 51CTO技术栈(微信号:blog51cto) 就在昨天,一家名不见经传的初创公司在OpenAI的官宣之下迅速走红。推出Sora之后,OpenAI的动作让业界变得越发敏感。 图片 万万没想到,这家“名不见经传”的初创公司竟然是Fig...
-
在Kubernetes上部署生成式人工智能应用程序的分步指南
译者 | 李睿 审校 | 重楼 在当今快节奏的技术和市场环境中,高效地部署人工智能(AI)/机器学习(ML)应用程序至关重要。Kubernetes是一个强大的开源平台,已经成为管理和扩展容器化应用程序的领先解决方案,确保它们在各种环境中无缝运行。 在本...
-
探秘Orange3:打开数据挖掘与机器学习新世界!
Orange3是一个强大的开源数据可视化和机器学习工具,它提供了丰富的数据处理、分析和建模功能,使用户能够快速、简单地进行数据挖掘和机器学习任务。 本文将介绍Orange3的基本功能和使用方法,并结合实际应用场景和Python代码案例,帮助读者更好地了解...
-
Llama3将于7月发布!当下处于微调中!
整理 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 据一位熟悉Llama 3人士透露,Meta计划于7月发布Llama 3。据悉,Llama 3的最大版本可能会超过1400亿个参数,超过其前身Llama 2。 Meta希望Llama...
-
webassembly002 whisper.wasm wasm_eval 与js代码交互 js部分
html的js <script type="text/javascript" src="https://blog.csdn.net/ResumeProject/article/details/helpers.js"><...
-
OpenAI与开源多语言嵌入模型,你选择哪一家?
译者 | 朱先忠 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 本文对OpenAI的多个嵌入模型与多家开源的多语言嵌入模型进行了综合比较,帮助你最终选择最适合自己的大数据开发模型。 1.引言 OpenAI最近发布了他们的...
-
Stable-Diffusion ubuntu服务器部署,报错解决方法(小白教程)
Stable Diffusion是一个深度学习模型,专注于生成高质量的图像。它由CompVis团队与Stability AI合作开发,并在2022年公开发布。这个模型使用文本提示(text prompts)生成详细、逼真的图像,是目前人工智能图像生成领域的...
-
北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应
重磅: 北大团队联合兔展发起了一项Sora复现计划——Open Sora。 框架、实现细节已出: 初始团队一共13人: 带队的是北大信息工程学院助理教授、博导袁粒和北大计算机学院教授、博导田永鸿等人。 为什么发起这项计划? 因为资源有限,团队希望集结...
-
硅谷钢铁侠起诉奥特曼!GPT-4开源有希望了?
撰稿 |言征 出品 | 51CTO技术栈(微信号:blog51cto) 马斯克又上头条了!“OpenAI 、奥特曼为了利润公然背叛”,“OpenAI董事会改组是微软精心策划的”,“OpenAI是微软事实上的子公司”,“GPT4相当于微软事实上的专有算法”...
-
LLaMA-Factory 基于docker的大模型多卡分布式微调
LLaMA-Factory是一个相当优秀的微调工具。这里提供一个dockerfile和一个train脚本,用于多卡微调,供大家参考。 Dockerfile FROM nvidia/cuda:12.1.0-cudnn8-devel-ubuntu22.0...
-
OpenAI ChatGPT-4开发笔记2024-08:windows本地环境下载Llama 2
Step 1: Ask for permission on Meta’s website To be able to download the model, you first need to agree to some terms and condi...
-
基于大型语言模型和向量数据库开发新闻推荐系统
译者 | 朱先忠 审校 | 重楼 近年来,随着诸如ChatGPT、Bard等生成式人工智能工具的发布,大型语言模型(LLM)在机器学习社区引起了全球热议。这些解决方案背后的核心思想之一是计算非结构化数据(如文本和图像)的数字表示,并找出这些表示之间的相似...
-
可视化FAISS矢量空间并调整RAG参数提高结果精度
随着开源大型语言模型的性能不断提高,编写和分析代码、推荐、文本摘要和问答(QA 对的性能都有了很大的提高。但是当涉及到QA时,LLM通常会在未训练数据的相关的问题上有所欠缺,很多内部文件都保存在公司内部,以确保合规性、商业秘密或隐私。当查询这些文件时,会...
-
Stable Diffusion系列课程上:安装、提示词入门、常用模型(checkpoint、embedding、LORA)、放大算法、局部重绘、常用插件
文章目录 一、Stable Diffusion安装与源码解析 1.1 Stable Diffusion安装 1.2 webui启动代码分析 1.2.1 加载webui-user.sh 1.2.2 执行launch.py 1.2.3 执行we...
-
10|AI连接外部资料库,让Llama Index带你阅读一本书
有不少人在使用 OpenAI 提供的 GPT 系列模型的时候,都反馈效果并不好。这些反馈中有一大类问题,是回答不了一些简单的问题。比如当我们用中文问 AI 一些事实性的问题,AI 很容易胡编乱造。而当你问它最近发生的新闻事件的时候,它就干脆告诉你它不知道...
-
Kernel-CF:推荐系统的最优召回策略
作者 | 汪昊 审校 | 重楼 推荐系统自诞生以来广受关注,尤其是互联网领域,推荐系统已经成为了给企业下金蛋的白鹅。我们来算一笔账,假设我们公司推荐产品的日 PV 是500 万,推荐系统让用户点击率提升了1%, 也就是一天增加了5 万 PV。Google...
-
强力推荐!史上最强logo设计Midjourney提示词合集
作为资深设计师, 我深知一个好的 logo 对提升品牌形象有多么重要。但是设计一个新颖又富有辨识度的 logo 往往难于登天。我相信很多设计师和我一样,为 logo 设计问题而彻夜难眠。 为了解决我们共同的痛点, 我潜心研究, 吐血整理出 22 条 Mi...
-
AIGC专栏9——Scalable Diffusion Models with Transformers (DiT)结构解析
AIGC专栏9——Scalable Diffusion Models with Transformers (DiT)结构解析 学习前言 源码下载地址 网络构建 一、什么是Diffusion Transformer (DiT 二、DiT的组成...
-
李沐学AI--DALL·E 2 + Diffusion Model
DALL·E 2 CLIP的一半的反过程 clip是 text–> text feature image --> image fueture 对比找相似的,就能进行分类任务,将给定的图像与给定的text对应起来。 dall e2是 text...
-
Ubuntu环境中Stable Diffusion的roop插件安装(8.12更新)
roop插件是一款换脸神器,可以在Stable Diffusion中实现一键换脸,现在已经有了基于automatic1111的web-ui开源项目上的插件。 windows版本上的安装教程已经很多了,这边就不说了。下面是ubuntu中的安装过程。 1....
-
使用websocket后端接入文心一言
最近再写项目练手,想着最近大模型那么火,也想接入项目来玩一玩,于是去了解了一下相关的api和通信协议,最后选择了文心一言进行集成,国内的相对稳定。ERNIE-Bot-turbo - 千帆大模型平台 | 百度智能云文档 (baidu.com 使用webs...
-
AIGC实战——扩散模型(Diffusion Model)
AIGC实战——扩散模型 0. 前言 1. 去噪扩散概率模型 1.1 Flowers 数据集 1.2 正向扩散过程 1.3 重参数化技巧 1.4 扩散规划 1.5 逆向扩散过程 2. U-Net 去噪模型 2.1 U-Net 架构 2.2...
-
自动驾驶与轨迹预测看这一篇就够了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈...
-
微软牵手OpenAI劲敌!Mistral最新顶级大模型不再开源
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 近日,微软宣布与估值约20亿美元的法国AI独角兽Mistral达成合作伙伴关系。 众所周知,成立于去年5月的Mistral凭借其首个模型Mistral 7B就引起了全球AI界的瞩目...
-
【论文精读】OS-Copilot: Towards Generalist Computer Agents with Self-Improvement
OS-Copilot: Towards Generalist Computer Agents with Self-Improvement 前言 ABSTRACT 1 INTRODUCTION 2 THE OS-COPILOT FRAMEWORK...
-
可控核聚变新里程碑!AI成功预测等离子体撕裂登Nature,清洁能源「圣杯」更近一步
可控核聚变,又有新突破了! 长期以来,核聚变一直受着一个「幽灵」的困扰——等离子体不稳定性问题。 而最近,普林斯顿团队用AI提前300毫秒预测了核聚变等离子不稳定态,这个时间,就足够约束磁场调整应对等离子体的逃逸! 从此,科学家可以防止可控核聚变的中断,...
-
8/8/6/3的Mamba论文,最终还是被ICLR 2024拒了,网友:悬着的心终于死了
几天前,ICLR 2024 的最终接收结果出来了。 大家应该还记得,Mamba 被 ICLR 2024 大会 Decision Pending(待定)的消息在 1 月份引发过一波社区热议。 当时,多位领域内的研究者分析,Decision Pending...
-
webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools
python绑定的相关项目 官方未提供python的封装绑定,直接调用执行文件 https://github.com/stlukey/whispercpp.py提供了源码和Cpython结合的绑定 https://github.com/zh...
-
一种推荐系统中的排序学习的原创算法:斯奇拉姆排序
作者 | 汪昊 审校 | 重楼 排序学习在推荐系统中的应用在最近数年来非常罕见。经典的算法比如 BPR 和 CLiMF 早在 10 多年前就已经被发明。因此当 2023 年国际会议 AIBT 2023 上有学者提出斯奇拉姆排序时,众多听众眼前一亮。该算...
-
超有趣的stable diffusion干货解读
超有趣的stable diffusion干货解读 智能时代:向量和模型构成一切(Vector and models rule it all ——朱嘉明 从老式电视机上的雪花引出diffusion Stable Diffusion 的组成 为...
-
借助知识图谱和Llama-Index实现基于大模型的RAG
幻觉是在处理大型语言模型(LLMs)时常见的问题。LLMs生成流畅连贯的文本,但经常产生不准确或不一致的信息。防止LLMs中出现幻觉的一种方法是使用外部知识源,如提供事实信息的数据库或知识图谱。 矢量数据库和知识图谱使用不同的方法来存储和表示数据。矢量数...
-
人脸识别要完?首个“人脸劫持“银行木马诞生
多年来,生物识别技术被宣传为终极身份验证手段,因为每个人的面部、指纹和虹膜信息都独一无二且难以被伪造。然而,随着人工智能技术的井喷式发展,生物识别技术,尤其是人脸识别技术正面临巨大威胁。 近日,网络安全公司Group-IB发现了首个能够窃取人脸(识别数...
-
保姆级amd显卡win11搭建stable diffusion教程,GPU运算,而不是CPU运算!!!
1.安装Git 2.安装python python版本一定要是3.10.6 如果是其他版本,请卸载后再重新安装此版本 3.git代理配置 此步骤主要是解决拉github源码慢的问题,如果有vpn客户端的同学,记得要单独再配置下git的代理配置...
-
【AI绘画】硬核解读Stable Diffusion(完整版) 小白必收藏!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 2022年可谓是AIGC(AI Generated Content)元年,上半年有文生图大模型DALL-E2和Sta...
-
【AIGC】Stable Diffusion之模型微调工具
推荐一款好用的模型微调工具,cybertron furnace 是一个lora训练整合包,提供训练 lora 模型的工具集或环境。集成环境包括必要的依赖项和配置文件、预训练脚本,支持人物、二次元、画风、自定义lora的训练,以简化用户训练 lora 模型...
-
NLP独角兽被曝停工停产!融了10亿仍难造血,大模型热浪中更难活了
明星NLP公司突发消息:停工停产6个月。 最新流传一张截图显示,竹间智能即日起(2月20日起)部分部门和岗位停工重组。 原因也很直接:由于公司所处经营环境艰难,受到多方不利影响。 一时间让不少网友觉得意外,上一波AI公司快要没饭吃了? 要说一年前,...
-
AIGC报告专题:计算机Pika-AIGC新秀-视频生成产业或迎来GPT时刻
今天分享的AIGC系列深度研究报告:《AIGC报告专题:计算机Pika-AIGC新秀-视频生成产业或迎来GPT时刻》。 (报告出品方:中泰证券) 报告共计:11页 Pika:专注Text to Video生成场景,支持3D和动漫 ◼ Pika成...
-
70%!GenAI大大提升软件开发效率!
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)近日,总部位于纽约的管理咨询公司 Zinnov 和数据工程和生命周期公司Ness Digital engineering 联合发起了一项题为“利用生成式人工智能(GenAI)的力量转变...
-
被字节辟谣的中文版Sora,究竟厉害在哪里?
撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 近日,市场有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款新型视频模型Boximator,与Gen-2、Pink1.0等既有模型相比,Boximator的独特...
-
Llama深入浅出
前方干货预警:这可能是你能够找到的最容易懂的最具实操性的学习开源LLM模型源码的教程。 本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼 。 并且训练它来实现一个有趣的实例:两数之和。 输入...
-
详解面向 Java 开发人员的机器学习案例
译者 | 陈峻 审校 | 重楼 自去年以来,诸如ChatGPT 和 Bard之类的大语言模型已将机器学习提升到了一种现象级的地位。开发人员使用它们在辅助编程方面不断探索了从图像生成到疾病检测等领域的应用案例。 鉴于全球各大科技公司都在加大针对机器学习的...
-
Meta、谷歌、特斯拉,竞争对手联合起来吐槽OpenAI!Sora不懂物理世界,它只是GPT3!
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 上周,OpenAI的第一个视频生成模型Sora在互联网上疯传。然而,与此同时,来自竞争对手公司的一批人工智能专家和研究人员迅速剖析和批评了Sora的Transformer模型,引...
-
2024年GenAI和其他技术的投资变化
本文介绍了2024年GenAI和其他技术的投资变化。 数字密度 其中一个转变集中在数字密度上,你可以把几乎任何大型企业的科技产业分为数字密度高或低的产业,高数字密度指的是在过去十年里已经投资将大部分房地产转移到云中的公司。 2024年,人们将低数字密度...
-
机器学习中七种常用的线性降维技术总结
上篇文章中我们主要总结了非线性的降维技术,本文我们来总结一下常见的线性降维技术。 1、Principal Component Analysis (PCA Principal Component Analysis (PCA 是一种常用的降维技术,用于...
-
如何使用MyScale将知识库引入OpenAI的GPT
译者 | 李睿 审校 | 重楼 2023年11月6日,OpenAI公司对外发布了ChatGPT。在这个无代码平台上,专业(或业余 开发人员可以使用工具和提示构建定制的GPT或聊天机器人,有效地改变他们与OpenAI GPT的交互。以前的交互(LangCh...
-
Python进行AI声音克隆的端到端指南
人工智能语音克隆是一种捕捉声音的独特特征,然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音,还可以创造全新的声音。它是一种彻底改变内容创作的工具,从个性化歌曲到自定义画外音,开辟了一个超越语言和文化障碍的创意世界。 本文的将提供利用AI语音...