-
【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比
MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析,包括性能、应用场景和技术特点。 从性能角度来看,MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色,实现了开源模型的性能SOTA...
-
工业知识图谱进阶实战
一、背景简介 首先来介绍一下云问科技的发展历程。 云问科技公司由 Chatbot 起家,在 2013 年到 2019 年间一直投身于 Chatbot 领域,主要关注人机对话方向,推出了很多客服类产品。后转型去做知识相关领域的原因是,在 Bert 发布之...
-
【AIGC半月报】AIGC大模型启元:2024.05(下)
AIGC大模型启元:2024.05(下) (1 豆包大模型(抖音大模型) (2 Project Astra(谷歌对标GPT-4o) (3 Chameleon(meta对标GPT-4o) (4 MiniCPM-Llama3-V 2.5(面...
-
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
在 Transformer 大一统的时代,计算机视觉的 CNN 方向还有研究的必要吗? 今年年初,OpenAI 视频大模型 Sora 带火了 Vision Transformer(ViT)架构。此后,关于 ViT 与传统卷积神经网络(CNN)谁更厉害的争...
-
【AI绘画】Stable Diffusion魔法修习—“画风“自由切换(stable diffusion模型下载与使用技巧)
stable diffusion模型文件指AI学习了大量指定风格图片后,存储了这些学习信息的文件,可以用来绘制特定风格的图片。 大模型chickpoint(检查点 :可以理解为保存指定节点的模型文件。训练模型特别耗算力,保存到指定节点之后,可以方便下次继...
-
ollama部署体验Chinese-LLaMA-Alpaca-3大模型项目
前言 书接上回:快速评测已有的中文llama-3开源模型(4月25日更新)_llama3-chinese-novel-CSDN博客 虽然Llama-3大模型发布以后,中文适配模型也出了一大堆,但效果都不尽人意,参差不齐。近期,Chinese-LLaMA...
-
LMDeploy高效部署Llama-3-8B,1.8倍vLLM推理效率
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,LMDeploy 对 Llama 3 部署进行了光速支持,同时对 LMDeploy 推理 Llama 3 进行了测试,在公平比较的条件下推理效率是 vLLM 的 1.8 倍。 书生...
-
意外!老黄剧透下一代GPU芯片,新演讲又把摩尔定律按在地上摩擦
刚刚,中国台湾大学体育场,欢呼阵阵如同演唱会,但这次“摇滚巨星”,其实是英伟达创始人黄仁勋,再次回到学校,带来Computex重磅演讲,以及英伟达的新一代GPU。 是的,英伟达新架构Blackwell宣布不过3个月,老黄就把后三代路线图全公开了: 20...
-
AnythingLLM:零成本的私人ChatGPT,支持几乎所有主流大模型
用过大模型的都知道,我们不怕它不回答,就怕它乱回答,特别是一眼还看不出来的那种。即便是最先进的AI模型也会说谎,防不胜防。对企业来说,幻觉,已经成为阻碍大模型应用的严重缺陷性问题。 除了幻觉,通用大模型无法满足企业实际业务需求还涉及到知识局限性、信息安全...
-
让大模型发挥更大作用,离不开知识库这个关键要素
在大模型的世界里,有一些黑话,比如“抽卡”和“炼丹”。这些术语听起来轻松有趣,但要让“仙丹”真正发挥作用,背后离不开一个关键要素——知识库。 从自然语言处理(NLP)、内容生成到图像识别,大模型在各个领域都展现出了惊人的能力。然而大模型在处理特定领域问...
-
活体脑细胞做成16核芯片,用Python就能编程,九个机构开展实验36所大学排队
首个“脑PU”来了!由“16核”类人脑器官(human brain organoids)组成。 这项研究来自瑞士生物计算创业公司FinalSpark,并且他们宣称: 这种生物处理器(bioprocessor)的功耗比传统数字处理器低100万倍。 这些类脑...
-
字节跳动旗下 AI 助手豆包推出PC客户端、浏览器插件版本
近日,字节跳动旗下 AI 助手豆包正式推出了PC客户端下载,包括了Windows / MAC版本,同时,还推出了浏览器插件版本。 据悉,豆包PC客户端版本支持快捷划词翻译、AI 搜索、一键常驻桌面等功能。而插件版则提供一键总结网页与视频、写作和文本修改等...
-
一模一样!斯坦福AI团队被曝抄袭中国国产大模型:直接删库跑路
快科技6月3日消息,近日,斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。 斯坦福的Llama3-V项目在5月29日发布,宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Cl...
-
Stable Diffusion 绘画入门教程(webui)-ControlNet(姿态预处理器openpose)
本片文章接着上篇文章ControlNet介绍他的控制类型,本篇介绍的预处理器为openpose 预处理器:openpose 模型:control_v11p_sd15_openpose 没下载模型的看上篇文章去下载一下哦,不然用不了...
-
昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的,是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。...
-
Stable Diffusion【进阶篇】:模特换装之图生图实现
文章使用的AI绘画SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。 真人换装是图生图的一个典型应用。在图生图中可以通过局部重绘和涂鸦重绘两种方式实现,2种实现方式都差不多,不同的在于涂鸦重绘...
-
腾讯元宝全面测评!国产AI“看剧”时代开启!读懂《庆余年》范闲,揭秘奥特曼宫斗!打通腾讯生态“全村的希望”!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 腾讯在大模型上的动作姗姗来迟。 对于“后发”的抉择,腾讯想得很清楚。 在“腾讯元宝”上线的发布会上,腾讯云副总裁、腾讯混元大模型负责人刘煜宏说,“虽然行业内看起来火热,但是中国移动...
-
【AIGC】本地部署 ollama(gguf) 与项目整合
首先,先跟各位小伙伴说一句 Sorry 。上一篇文章《【AIGC】本地部署通义千问 1.5 (PyTorch 》并没有考虑企业成本问题,虽然代码可以跑通,但是中小型企业想通过该代码实现项目落地还是比较困难的。为此,本文将采用 GGUF 预量化大模型结合 O...
-
沙特阿美投资中国AI初创企业智谱AI 估值达30亿美元
据国外媒体报道,沙特阿拉伯国有石油集团沙特阿美的风险投资部门Prosperity7近日参与了中国生成式人工智能初创企业智谱AI的新一轮融资,投资金额约为4亿美元,使得智谱AI的估值达到了约30亿美元。 图源备注:图片由AI生成,图片授权服务商Midjou...
-
7B?13B?175B?解读大模型的参数
大模型也是有大有小的,它们的大小靠参数数量来度量。GPT-3就有1750亿个参数,而Grok-1更是不得了,有3140亿个参数。当然,也有像Llama这样身材苗条一点的,参数数量在70亿到700亿之间。 这里说的70B可不是指训练数据的数量,而是指模型中...
-
2024过半,AI卷到哪儿了?
AI创业者陈冉,发现行业里有一些“怪现象”。 很多客户向他反馈,自己很困惑。一方面,大模型更新速度太快,搞不清楚到底哪个好用;同时,自己也不知道大模型怎么跟业务结合;另外,自己的数据集究竟能不能精调出一个好用的大模型,心里也没谱。 最后的结果就是,愿意投入...
-
OpenAI把GPT-4原始版给了他们:研究不微调只靠提示词能走多远
除了OpenAI自己,居然还有别人能用上GPT-4-Base版?? 也就是未经微调的预训练版,还不会对话聊天,只会补全句子的模型。 EPFL(瑞士洛桑联邦理工)团队申请到了访问权限,用于研究“上下文学习足以让大模型跟随指令吗?”。 也就是不用监督微调、...
-
麦肯锡调查显示:生成式AI应用大中华区增长最快
据全球顶级咨询公司麦肯锡(McKinsey & Company)发布的最新调查报告《he state of AI in early2024:Gen AI adoption spikes and starts to generate value》,显...
-
超越Devin!姚班带队,他们创大模型编程新世界纪录
超越Devin!SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。 同时创造了非GPT-4o基模的最高纪录(SOTA)。 我们都知道,SW...
-
生成式人工智能(AIGC),到底对企业、对商业有何影响,我们个体未来如何把握发展机会?
一、中国生成式人工智能行业整体发展现状 中国生成式人工智能行业进入爆发式增长阶段,2023年以来各类入局企业近500家,整体产业热度上呈现出“应用层 > 模型层 > 数据层 > 算力层”的发展轨迹。其中,应用层直面下游用户,有望...
-
英伟达新研究:上下文长度虚标严重,32K性能合格的都不多
无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长度的都有。 但一番考验下来,在新指标“有效上下文”上缩水严重,能达到32K的都不多。 新基准名为RULER,包含检索、多跳追踪、...
-
ICML2024高分!魔改注意力,让小模型能打两倍大的模型
改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。 DCMHA解除...
-
AI摄影 | Stable Diffusion 真人照片转动漫
大家好,我是程序员晓晓 “ 相信我们很多人在看过动漫/动画后,都想看一看二次元世界中的自己长什么样子,那今天就以客户照片为例,说说我们如何用 Stable Diffusion,让 AI 帮我们将真实照片转成一个绝美二次元美男子……” 客户原图是这样的,...
-
whisper-v3模型部署环境执行
1. 安装whisperV3 github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-ru...
-
LLM的「母语」是什么?
大语言模型的「母语」是什么? 我们的第一反应很可能是:英语。 但事实果真如此吗?尤其是对于能够听说读写多种语言的LLM来说。 对此,来自EPFL(洛桑联邦理工学院)的研究人员发表了下面这篇工作来一探究竟: 图片 论文地址:https://arxiv.or...
-
【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么
LLaVA++能够为Phi-3和Llama-3带来的主要好处包括: 视觉处理能力的增强:通过整合Phi-3和Llama-3模型,创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本,这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...
-
【AIGC调研系列】XTuner、Unsloth方案对比
XTuner和Unsloth都是用于大型语言模型(LLM)训练和微调的工具,但它们在设计理念、技术实现和性能表现上存在一些差异。 技术架构与支持的模型规模: XTuner支持千亿级参数的模型,并能够处理超过百万个tokens的序列。它通过序列...
-
AI绘画Stable Diffusion:从新手到高手,漫画小说创收不是梦,几条视频变现几k(Ai工具+教程)
大家好,我是灵魂画师向阳 许多人都被大量的小说推文项目所淹没,看着别人收益高、账号做得好, 很多人讲述这个项目时,要么不透露具体AI工具名称, 要么不提供推文授权渠道,让人无从下手,干着急。 今天,向阳将带给大家一期全新的纯AI制作小说推文项目, 这个...
-
docker部署stable-diffusion-webui
大模型弄好了,想着玩玩stable-diffusion-webui,结果折腾了几天无果,最后使用大佬的docker镜像弄好了。 Ubuntu20.4 docker运行stable diffusion webui_siutin/stable-diffusi...
-
【独家】万字长文带你梳理Llama开源家族:从Llama-1到Llama-3
Datawhale干货 作者:张帆,陈安东,Datawhale成员 引言 在AI领域,大模型的发展正以前所未有的速度推进技术的边界。 北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-...
-
最近很火的粘土滤镜被玩坏了,教你用AI绘画SD免费无限制使用,附教程!
大家好,我是阿威。 最近在小红书上,“粘土特效”、“粘土滤镜”异常爆火,被网友玩出了花。 原来,一款海外修图工具——Remini(类似妙鸭相机)上线AI滤镜功能,其中就包括粘土滤镜,非常有新意。 目前苹果AppStore可以自由下载,国内安卓...
-
首次解密Claude 3大脑!25岁Anthropic参谋长预言3年内自己将被AI淘汰
【新智元导读】Anthropic的25岁参谋长自曝因为深感AGI,未来三年自己的工作将被AI取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说,Claude3模型已经初现AGI了吗? 今天,整个AI社区被这篇文章刷屏了。 来自AI明星初创公司A...
-
基于百度语音识别、文心一言大模型、百度语音合成的一套完整的语音交互(利用Python实现)
本人小白,因为毕设项目需要用的语音交互,便查网上的资料利用百度api实现,比较简单的过程,供大家借鉴批判。 项目框架大致分为3步:(1)百度语音识别可以将我们输入的语音转化为文本输入到文心一言大模型;(2)文心一言大模型根据输入以输出响应文...
-
阿里蔡崇信最新发声!训练AI就像教育孩子 三四年就能赶超博士
快科技6月2日消息,阿里巴巴集团的董事长蔡崇信,在最新一次对话中,对人工智能的快速发展和未来前景进行了深入的阐述。 他将训练AI模型的过程比喻为教育孩子,大语言模型的发展竞赛,就像家长展示自己孩子的学术成就一样。 尽管培养一个孩子需要22年时间,但AI在三...
-
欢迎 Llama 3:Meta 的新一代开源大语言模型
介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Fac...
-
AI绘画动漫转真人详细教程
从小到大,我们看过的动漫、玩过的游戏有很多很多 但我们会发现里面的角色或者人物都是二次元的 我就会好奇这些动漫人物在现实中会长什么样 而现在,我们通过AI绘画竟然就能还原出来他们现实中的样子 除了动漫角色和游戏人物,古代的画像、经典...
-
从零开始学AI绘画,万字Stable Diffusion终极教程(二)
【第2期】关键词 欢迎来到SD的终极教程,这是我们的第二节课 这套课程分为六节课,会系统性的介绍sd的全部功能,让你打下坚实牢靠的基础 1.SD入门 2.关键词 3.Lora模型 4.图生图 5.controlnet 6.知识补充...
-
AIGC、LLM 加持下的地图特征笔记内容生产系统架构设计
文章目录 背景 构建自动化内容生产平台 系统架构设计 架构详细设计 流程介绍 笔记来源 笔记抓取干预 笔记 AIGC 赋能 笔记 Rule 改写 笔记特征库构建 附录 Bash Cron 定时任务 Golang 与 Pyhon AIG...
-
微信公众号来到AI推荐时代
作为有能力打通整个腾讯内容生态的大模型产品,腾讯元宝的低调出手,已然在行业内引起广泛关注。 5月30日,腾讯混元大模型首个App“腾讯元宝”正式上线,定位为面向C端用户的全能AI助手,目前已登陆各大主流官方应用商店,网页端和小程序端也可以同步体验。 腾讯...
-
港大&百度发布首个智慧城市大模型UrbanGPT,助力时空预测技术突破
香港大学与百度联合发布了首个智慧城市大模型 UrbanGPT,该模型在时空预测技术领域引发了重大突破。时空预测技术的重要性日益凸显,不仅关注交通和人流的流动,还涵盖了犯罪趋势等多个维度。然而,由于城市数据不足,传统的时空预测模型在精确预测方面受到了限制。U...
-
ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文
ControlNet作者新项目,居然也搞起大模型和Agent了。 当然还是和AI绘画相关:解决大伙不会写提示词的痛点。 现在只需一句超简单的提示词说明意图,Agent就会自己开始“构图”: 这就是ControlNet作者Lvmin Zhang的新玩具...
-
一键 input 苹果 OpenELM,零门槛 Llama 3 教程,40+ 优质模型/数据集/教程,建议收藏!...
现在 AI 行业什么最火? 「大模型」一定仍然排在前三甲的位置。 自从 2022 年底 ChatGPT 面世以来,大模型在各行各业已经带来了太多的惊喜,应用场景愈发丰富,同时也带动了相关底层技术的普及与普适化。尤其是在开源模型繁荣发展之下,无...
-
基于 Llama-Index、Llama 3 和 Qdrant,构建一个 RAG 问答系统!
构建一个使用Llama-Index、Llama 3和Qdrant的高级重排-RAG系统 尽管大型语言模型(LLMs)有能力生成有意义且语法正确的文本,但它们面临的一个挑战是幻觉。 在LLMs中,幻觉指的是它们倾向于自信地生成错误答案,制造出看似令人信...
-
彻底火了!《AIGC 面试宝典》圈粉无数!
2022 年下半年以来,文本生成图像快速出圈,多款应用持续火爆。 国外文生图代表:Midjourney、Stable Diffusion、OpenAI 的 DALL-E: 海外模型SD开源,进一步促进了国内大厂的研究热情和应用落地: 随着多模态技术迭...
-
“全网最全”LLM推理框架集结营 | 看似微不足道,却决定着AIGC项目的成本、效率与性能!
00-前序 随着ChatGPT、GPT-4等大语言模型的出现,彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现,这些大语言模型有一部分是开源的,有一部分是闭源的。 伴随着大语言模型的出现,国...