-
微软ML Copilot框架释放机器学习能力
摘要:大模型席卷而来,通过大量算法模型训练推理,能根据人类输入指令产生图文,其背后是大量深度神经网络模型在做运算,这一过程称之为机器学习,本文从微软语言大模型出发,详解利用大型语言模型(Large Language Models, LLMs)解决实际机器学...
-
工业知识图谱进阶实战
一、背景简介 首先来介绍一下云问科技的发展历程。 云问科技公司由 Chatbot 起家,在 2013 年到 2019 年间一直投身于 Chatbot 领域,主要关注人机对话方向,推出了很多客服类产品。后转型去做知识相关领域的原因是,在 Bert 发布之...
-
Stable Diffusion Web UI Windows部署及坑
文章目录 1、准备 2、Miniconda安装 3、git安装 4、安装CUDA 4、开始部署 遇到的坑 1、准备 官网 需要翻墙软件 最少6G内存,显卡在2060以上 2、Miniconda安装 这是一个运行pytho...
-
AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解
不久前,AlphaFold3横空出世,直接登上了Nature头版。 新的架构、前所未有的预测精度和准确率,再次震撼了整个学术界。 然而,与AlphaFold2不同,这个新一代的超强模型却没有开源。 取而代之的是,谷歌DeepMind推出了一个免费研究平...
-
【AIGC半月报】AIGC大模型启元:2024.05(下)
AIGC大模型启元:2024.05(下) (1 豆包大模型(抖音大模型) (2 Project Astra(谷歌对标GPT-4o) (3 Chameleon(meta对标GPT-4o) (4 MiniCPM-Llama3-V 2.5(面...
-
ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜
Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。 文章地址:https://simonwillison.net/2024/May/29/trai...
-
Lobe UI - 基于 AntDesign 开发的 AIGC Web 应用的开源 UI 组件库
今天推荐一个可以快速开发 ChatGPT UI 界面的组件库,质量很高,拿来就能用。 Lobe UI 是由 lobehub 团队开发的一套 web UI 组件库,和我之前推荐的很多通用型的 UI 组件库不同,Lobe UI 是专门为目前火热的 AIGC...
-
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
在 Transformer 大一统的时代,计算机视觉的 CNN 方向还有研究的必要吗? 今年年初,OpenAI 视频大模型 Sora 带火了 Vision Transformer(ViT)架构。此后,关于 ViT 与传统卷积神经网络(CNN)谁更厉害的争...
-
llama.cpp 转化 huggingface 模型失败 解决路径
问题: ./main -m ./models/book_q4_K_M -n 128 报错: terminate called after throwing an instance of 'std::out_of_range' what( :...
-
快速学会一个算法,xLSTM
今天给大家分享一个超强的算法模型,xLSTM。 xLSTM(Extended Long Short-Term Memory)是对传统 LSTM(Long Short-Term Memory)模型的扩展和改进,旨在提升其在处理时间序列数据和序列预测任务中的...
-
【AI绘画】Stable Diffusion魔法修习—“画风“自由切换(stable diffusion模型下载与使用技巧)
stable diffusion模型文件指AI学习了大量指定风格图片后,存储了这些学习信息的文件,可以用来绘制特定风格的图片。 大模型chickpoint(检查点 :可以理解为保存指定节点的模型文件。训练模型特别耗算力,保存到指定节点之后,可以方便下次继...
-
不想炸薯条的Ilya和不送GPU的英伟达,Hinton最新专访:道路千万条,安全第一条
从谷歌离职一年之际,「人工智能教父」Hinton接受了采访。 ——也许是因为徒弟Ilya终于被从核设施中放了出来?(狗头) 视频地址:https://www.youtube.com/watch?v=tP-4njhyGvo 当然了,采访教父的小伙子也非等...
-
Midjourney软件介绍及使用教程
文章主要有四个部分: 一、Midjourney安装教程(简单略过); 二、认识AI绘图指令; 三、MJ常用后缀参数指令; 四、文本提示词 注:Mj不是修图的工具,只是语言的工具。只是修图的辅助工具,做图要结合PS来. 第一部分:Midjou...
-
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mix...
-
AMD:四季度推出MI325X AI芯片 比英伟达H200快30%
快科技6月3日消息,AMD CEO苏姿丰在COMPUTEX台北国际电脑展演讲,发布最新的AI芯片:MI325X。 苏姿丰表示,MI300系列一直以来都是AMD迅速发展的明星产品,而全新一代的MI325X更是继承了这一优良传统。这款芯片不仅搭载了先进的HBM...
-
ollama部署体验Chinese-LLaMA-Alpaca-3大模型项目
前言 书接上回:快速评测已有的中文llama-3开源模型(4月25日更新)_llama3-chinese-novel-CSDN博客 虽然Llama-3大模型发布以后,中文适配模型也出了一大堆,但效果都不尽人意,参差不齐。近期,Chinese-LLaMA...
-
首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度
时空预测技术,迎来ChatGPT时刻。 时空预测致力于捕捉城市生活的动态变化,并预测其未来走向,它不仅关注交通和人流的流动,还涵盖了犯罪趋势等多个维度。目前,深度时空预测技术在生成精确的时空模型方面,依赖于大量训练数据的支撑,这在城市数据不足的情况下显得...
-
搭载AMD最新锐龙AI 9 HX 370旗舰CPU!华硕发布新款Zenbook S 16
快科技6月3日消息,华硕在Computex 2024台北国际电脑展上发布了全新笔记本电脑Zenbook S 16,该款笔记本搭载了AMD最新发布的锐龙AI 9 HX 370处理器。 该机型采用Ceraluminum材质机身,重量为1.5kg,厚度薄至1.1...
-
LMDeploy高效部署Llama-3-8B,1.8倍vLLM推理效率
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,LMDeploy 对 Llama 3 部署进行了光速支持,同时对 LMDeploy 推理 Llama 3 进行了测试,在公平比较的条件下推理效率是 vLLM 的 1.8 倍。 书生...
-
意外!老黄剧透下一代GPU芯片,新演讲又把摩尔定律按在地上摩擦
刚刚,中国台湾大学体育场,欢呼阵阵如同演唱会,但这次“摇滚巨星”,其实是英伟达创始人黄仁勋,再次回到学校,带来Computex重磅演讲,以及英伟达的新一代GPU。 是的,英伟达新架构Blackwell宣布不过3个月,老黄就把后三代路线图全公开了: 20...
-
Stable Diffusion 指定模型,Lora 训练全流程
简介 在使用 Stable Diffusion 的时候,可以选择别人训练好的 Lora,那么如何训练自己的 Lora呢? 本篇文章介绍了如何训练Lora,如何筛选模型,如何在 Stable Diffusion 中使用。 闲话不多说,直接实际操作吧。...
-
AnythingLLM:零成本的私人ChatGPT,支持几乎所有主流大模型
用过大模型的都知道,我们不怕它不回答,就怕它乱回答,特别是一眼还看不出来的那种。即便是最先进的AI模型也会说谎,防不胜防。对企业来说,幻觉,已经成为阻碍大模型应用的严重缺陷性问题。 除了幻觉,通用大模型无法满足企业实际业务需求还涉及到知识局限性、信息安全...
-
Midjourney新功能:角色参照指南
基本概念 角色参照(Character Reference):这个功能允许用户在不同的图像生成中保持给定参照角色的一致性。 适用模型:适用于Midjourney V6和Niji6型号。 功能亮点 跨风格一致性:可以在不同风格(如动漫风、写实...
-
让大模型发挥更大作用,离不开知识库这个关键要素
在大模型的世界里,有一些黑话,比如“抽卡”和“炼丹”。这些术语听起来轻松有趣,但要让“仙丹”真正发挥作用,背后离不开一个关键要素——知识库。 从自然语言处理(NLP)、内容生成到图像识别,大模型在各个领域都展现出了惊人的能力。然而大模型在处理特定领域问...
-
AIGC时代之 - 怎样更好的利用AI助手 - 指令工程
爆火的AIGC 2022年11月30日,OpenAI发布ChatGPT 3 2022年12月4 日,ChatGPT 3 已拥有超过一百万用户 2023年各种大语言模型开始火爆全球 GPT们,已经成为了我工作和学习的非常重要的工具。 ChatGPT...
-
活体脑细胞做成16核芯片,用Python就能编程,九个机构开展实验36所大学排队
首个“脑PU”来了!由“16核”类人脑器官(human brain organoids)组成。 这项研究来自瑞士生物计算创业公司FinalSpark,并且他们宣称: 这种生物处理器(bioprocessor)的功耗比传统数字处理器低100万倍。 这些类脑...
-
字节跳动旗下 AI 助手豆包推出PC客户端、浏览器插件版本
近日,字节跳动旗下 AI 助手豆包正式推出了PC客户端下载,包括了Windows / MAC版本,同时,还推出了浏览器插件版本。 据悉,豆包PC客户端版本支持快捷划词翻译、AI 搜索、一键常驻桌面等功能。而插件版则提供一键总结网页与视频、写作和文本修改等...
-
Llama-Factory 简介 二, 脚本详解 LLaMA-Factory/src/train_bash.py LLaMA-Factory/src/llmtuner/train/pt/workfl
examples/ ├── lora_single_gpu/ │ ├── pretrain.sh: 基于 LoRA 进行增量预训练 │ ├── sft.sh: 基于 LoRA 进行指令监督微调 │ ├── reward.sh: 基于 LoRA...
-
Neuralink劲敌破纪录,4096个电极微创植入人脑!脑机接口有望进入「5G」时代
提到脑机接口,你第一时间想到的肯定是Elon Musk创建的公司Neuralink,他们在今年1月刚刚将首个芯片植入人脑。 但Neuralink绝不是唯一发力脑机接口的公司。 5月28日,Precision Neuroscience发布公告,他们成功在人...
-
一模一样!斯坦福AI团队被曝抄袭中国国产大模型:直接删库跑路
快科技6月3日消息,近日,斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。 斯坦福的Llama3-V项目在5月29日发布,宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Cl...
-
Stable Diffusion 绘画入门教程(webui)-ControlNet(姿态预处理器openpose)
本片文章接着上篇文章ControlNet介绍他的控制类型,本篇介绍的预处理器为openpose 预处理器:openpose 模型:control_v11p_sd15_openpose 没下载模型的看上篇文章去下载一下哦,不然用不了...
-
开发arXiv论文引擎机器人程序:基于RAG+LangChain+Chainlit+ChromaDB
译者 | 朱先忠 审校 | 重楼 简介 在本文中,我将演示如何使用检索增强生成(RAG 技术构建语义研究论文引擎。具体地说,我将使用LangChain(https://www.langchain.com/ 作为构建语义引擎的主要框架,以及OpenAI公...
-
昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的,是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。...
-
Stable Diffusion【进阶篇】:模特换装之图生图实现
文章使用的AI绘画SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。 真人换装是图生图的一个典型应用。在图生图中可以通过局部重绘和涂鸦重绘两种方式实现,2种实现方式都差不多,不同的在于涂鸦重绘...
-
腾讯元宝全面测评!国产AI“看剧”时代开启!读懂《庆余年》范闲,揭秘奥特曼宫斗!打通腾讯生态“全村的希望”!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 腾讯在大模型上的动作姗姗来迟。 对于“后发”的抉择,腾讯想得很清楚。 在“腾讯元宝”上线的发布会上,腾讯云副总裁、腾讯混元大模型负责人刘煜宏说,“虽然行业内看起来火热,但是中国移动...
-
调查:仅有4%青少年和年轻人几乎每天使用AI工具
根据 Common Sense Media、Hopelab 和哈佛大学教育学院数字繁荣中心的最新数据显示,年轻的美国人正在迅速接受生成式人工智能作为一种工具,但很少有人已经将其纳入日常生活。调查报告《青少年和年轻人对生成式人工智能的看法》显示,仅有4% 的...
-
【AIGC】本地部署 ollama(gguf) 与项目整合
首先,先跟各位小伙伴说一句 Sorry 。上一篇文章《【AIGC】本地部署通义千问 1.5 (PyTorch 》并没有考虑企业成本问题,虽然代码可以跑通,但是中小型企业想通过该代码实现项目落地还是比较困难的。为此,本文将采用 GGUF 预量化大模型结合 O...
-
原来这才是生成式AI!
随着ChatGPT、文心一言等AI产品的火爆,生成式AI已经成为了大家茶余饭后热议的话题。 可是,为什么要在AI前面加上“生成式”这三个字呢? 难道还有别的AI吗? 且听文档君慢慢道来~ 1.生成式AI究竟是个啥? 如果将人工智能按照用途进行简单分类的话...
-
AI日报:SD 3宣布开源;中文语音AI天花板ChatTTS官网上线;Veo支持单图生成视频;ElevenLabs推多样化AI音频模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、抖音:将打击使用AI技术P图侮...
-
Defog发布Llama-3-SQLCoder-8B,文本转SQL模型,性能比肩GPT-4,准确率超90%,消费级硬件可运行
前言 在计算语言学领域,将自然语言转化为可执行的SQL查询是一个重要的研究方向。这对于让那些没有编程或SQL语法知识的用户也能轻松访问数据库信息至关重要。Defog团队近日发布了基于Llama-3的SQLCoder-8B模型,它在文本转SQL模型领域取得...
-
清洁数据,可信模型:确保您的LLM拥有良好的数据卫生
事实上,有些数据输入模型风险太大。有些可能带来重大风险,例如隐私侵犯或偏见。 译自Clean Data, Trusted Model: Ensure Good Data Hygiene for Your LLMs,作者 Chase Lee。 大语言模型...
-
橙篇AI有哪些功能使用教程指南详细介绍 百度橙篇AI使用地址入口
橙篇AI 是什么? 橙篇AI是一款针对写作领域的智能工具,旨在通过AI技术提升用户的写作效率和质量。它拥有一键生成长文、资料搜索、文档总结、全文校正等功能,帮助用户快速整理思路、搜集资料和校对文本。 橙篇AI 有哪些功能? 一键生成万字长文 资料搜...
-
Stable Diffusion使用Roop插件一键换脸教程
一、前言 先做个声明,下面图片都是AI工具生成,此技术不要做危害他人之事。 在AI绘画的学习过程中,有不少人希望可以用AI做个人写真,或者将AI生成的图片换成真人的脸做服装展示。训练模型也可以实现上面的需求,但是需要的图比较多,很麻烦。今天教大家使用...
-
利用人工智能和机器人推动科学发展
人类研究人员将永远在科学中发挥作用,但人类在探索科学方面有许多局限,我们需要吃饭和睡觉,我们的情绪会影响行为,我们的身体很容易受到不可挽回的伤害——所有这些都可能阻碍科学成就。美国阿贡国家实验室最近的发展表明,应该让机器人做一些工作,研究人员称之为“自主...
-
沙特阿美投资中国AI初创企业智谱AI 估值达30亿美元
据国外媒体报道,沙特阿拉伯国有石油集团沙特阿美的风险投资部门Prosperity7近日参与了中国生成式人工智能初创企业智谱AI的新一轮融资,投资金额约为4亿美元,使得智谱AI的估值达到了约30亿美元。 图源备注:图片由AI生成,图片授权服务商Midjou...
-
每日AIGC最新进展(7):频域引导的超分扩散模型、同时生成自然的说话面孔和语音输出Text-to-Speaking Face、4D全景场景图生成、语义感知的协同语音手势合成
Diffusion Models专栏文章汇总:入门与实战 Frequency-Domain Refinement with Multiscale Diffusion for Super Resolution http://arxiv.org/abs...
-
7B?13B?175B?解读大模型的参数
大模型也是有大有小的,它们的大小靠参数数量来度量。GPT-3就有1750亿个参数,而Grok-1更是不得了,有3140亿个参数。当然,也有像Llama这样身材苗条一点的,参数数量在70亿到700亿之间。 这里说的70B可不是指训练数据的数量,而是指模型中...
-
Arm预计到2025年底,将有1000亿台Arm设备为AI做好准备
英国芯片设计公司 Arm Holdings 预计,到2025年底,全球将有1000亿台 Arm 设备准备好进行人工智能应用。Arm 首席执行官 Rene Haas 在台北的 Computex 论坛上宣布了这一消息。这一消息意味着 Arm 设计的芯片设备将在...
-
Stable Diffusion插件(翻译)
Agent Scheduler(代理调度器):一个用于排队和跟踪任务历史的工具,使得管理生成任务变得井井有条。 TemporalKit(时间稳定工具包):这是一个全能解决方案,通过一个自动化扩展,为Stable Diffusion渲染添加时间稳定性,保持...
-
不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它
一般而言,训练神经网络耗费的计算量越大,其性能就越好。在扩大计算规模时,必须要做个决定:是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。 Scaling law 告诉我们:只要能适当地分配参数和数据,就能在固定计算预算下实...