-
在树莓派上运行语音识别和LLama-2 GPT!
目前,绝大多数大模型运行在云端服务器,终端设备通过调用api的方式获得回复。但这种方式有几个缺点:首先,云api要求设备始终在线,这对于部分需要在无互联网接入的情况运行的设备很不友好;其次,云api的调用需要消耗流量费,用户可能不想支付这部分费用;最后,如...
-
独角兽被微软挖角,新团队首曝光!情感AI嵌入机器人,超大内存升级情感体验
今年 3 月,人工智能领域的领军人物Mustafa Suleyman离开Inflection AI,转而领导微软的人工智能部门。 微软在如火如荼的人工智能人才争夺战中获胜的消息在科技界引起热议,但很少有人讨论这次离职对Inflection AI的影响。...
-
仅用250美元,Hugging Face技术主管手把手教你微调Llama 3
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 大语言模型的微...
-
AIGC学习:(一)langchain介绍
一、LangChain介绍 langChain是用于快速构建AI应用的框架(第三方开源库 。这里是官网,这里是Github 源码。 “一句话”介绍: 类似于Angular、React、Vue 等快速构建Web应用的前端框架. 类似于ReactNati...
-
ESP32接入国产大模型之文心一言:开启AI新篇章
随着人工智能技术的不断发展,AI模型的应用场景越来越广泛。作为国内领先的AI大模型,文心一言已经成为了众多企业和开发者的首选。而ESP32作为一款功能强大的微控制器,也广泛应用于各种智能硬件和物联网领域。近日,ESP32成功接入文心一言,这一合作将为AI应...
-
国产大模型登陆国产系统!百度文心一言上架统信应用商店
快科技5月28日消息,统信UOS官方宣布,由百度研发的人工智能大语言模型产品文心一言正式上架统信应用商店。 用户可通过统信应用商店一键下载、安装并使用文心一言。 统信表示,文心一言的上架,是统信应用商店在智能技术领域的重要拓展。 据了解,文心一言从去年3月...
-
【AIGC调研系列】CogVLM2:第二代视觉大模型
CogVLM2是智谱AI推出的新一代多模态大模型,继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器,并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...
-
人工智能AI和数字化世界走向何方
2024 年 5 月 23 日,美国众议院外交事务委员会以压倒性多数投票提交了一项法案,该法案将使拜登政府更容易限制 AI 系统的出口。该法案还将赋予美国商务部明确的权力,禁止美国人与外国人合作开发对美国国家安全构成威胁的 AI 系统。 路透社本月报...
-
如何在本地搭建集成大语言模型Llama 2的聊天机器人并实现无公网IP远程访问
文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址 随着ChatGPT...
-
英伟达赢麻了!马斯克xAI超级算力工厂曝光,10万块H100、数十亿美元
最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相投入巨额财力打造超级计算机(或大规模 GPU 集群)。他们认为,更强大的计算能力是实现更强大 AI 的关键。 早在 2022 年,Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI...
-
Hinton揭秘Ilya成长历程:Scaling Law是他学生时代就有的直觉
2003年夏天的一个周日,AI教父Hinton在多伦多大学的办公室里敲代码,突然响起略显莽撞的敲门声。 门外站着一位年轻的学生,说自己整个夏天都在打工炸薯条,但更希望能加入Hinton的实验室工作。 Hinton问,你咋不预约呢?预约了我们才能好好谈谈。...
-
多模态预训练模型在 OPPO 端云场景的落地实践
一、端侧图文检索技术研究 1. 解决了什么问题? 首先来介绍图文检索技术。以前在手机端相册搜索照片,都是基于标签来搜索。从 CLIP 模型出现后开始做自然语言搜索。目前正在解决端侧性能、搜索效果、安全等问题。技术难度并不大,重点在于提高搜索速度。并...
-
免费AI出图神器:StableStudio——定义AI作画新前景
StableStudio:探索艺术与科技的无限交界,StableStudio引领AI智能创作新浪潮! - 精选真开源,释放新价值。 概览 ChatGPT大语言模型AI的诞生引爆了对AIGC的讨论。AIGC 又称生成式 AI (Generat...
-
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。 然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。 比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。 定位能力的缺失直接限制了多模态...
-
离大模型落地应用最近的工程化技术(RAG)
虽然大规模语言模型(LLM)在自然语言处理(NLP)方面表现出了其强大的文本生成和理解能力,但是它们在实际应用中仍然面临一些挑战,如处理大规模知识库和实时获取最新信息的能力,并且会产生幻觉。为了解决这些问题,检索增强生成(Retrieval-Augmen...
-
只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调
自 2010 年起,AI 技术历经多个重大发展阶段,深度学习的崛起和 AlphaGo 的标志性胜利显著推动了技术前进。尤其是 2022 年底推出的 ChatGPT,彰显了大语言模型(LLM)的能力达到了前所未有的水平。自此,生成式 AI 大模型迅速进入高...
-
Shortened LLaMA:针对大语言模型的简单深度剪枝法
🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 论文标题 & 发表会议:Shortened LLaMA: A Simple Depth Pruning for Large Language Model...
-
Llama模型下载
最近llama模型下载的方式又又变了,所以今天简单更新一篇文章,关于下载的,首先上官网,不管在哪里下载你都要去官网登记一下信息:https://llama.meta.com/llama2 然后会出现下面的信息登记网页: 我这里因为待业所以or...
-
阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×22B!
本文原文来自DataLearnerAI官方网站:阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×22B! | 数据学习者官方网站(Datalearner https://www...
-
如何本地运行Llama 2大语言模型并实现无公网IP远程访问
文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址 随着ChatGPT...
-
知识分享系列五:大模型与AIGC
大模型(LLM,Large Language Mode)是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的深度学习模型。大模型主要用于进行自然语言相关任务,给模型一些文本输入,它能返回相应的输出,完成的具体任务包括生成、分类、总结、改写...
-
AIGC提示(prompt)飞升方法:走向专家之路
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
李飞飞:大模型不具备知觉,参数再多也不行
大模型已经具备知觉? AI教母李飞飞的最新回答旗帜鲜明:No。 她和斯坦福逻辑学家、哲学家John Etchemendy刚刚发表一篇合著文章,标题很直接: 文章中还写道: 这与图灵奖得主Yann LeCun的最新观点不谋而合。LeCun的言论还要更...
-
使用LM Studio与Anything LLM基于Llama-3高效构建本地知识库系统
本文详细介绍了如何使用LM Studio和Anything LLM工具来构建和部署本地知识库。文中首先解释了安装和配置大模型的步骤,随后展示了如何将模型部署为后台服务,并通过API进行调用。此外,文章还涉及了如何使用这些工具快速构建知识库应用,包括知识库的...
-
马斯克预测AI世界:人类无需再为生计奔波 工作将变成爱好
快科技5月24日消息,近日,埃隆马斯克在巴黎的欧洲科技创新展览会上分享了他对未来人工智能世界的预测。 他认为,随着AI技术的快速发展,未来社会将能够按需提供所有商品和服务。 在这样的环境下,人们将不再为了生计而工作,而是根据个人兴趣和爱好选择职业,更多地去...
-
生成式AI赋能零售银行产业:发掘潜力空间,规避业务陷阱
银行业领导者,对于生成式AI(GenAI)重塑客户体验和优化运营的潜力感到兴奋。麦肯锡的一项调查发现,生成式AI每年可增加2000亿至3400亿美元价值,推动收入增长2.8%至4.7%。零售银行业务成为银行业的第二大盈利部门,创造了540亿美元的新价值...
-
LLaMA Factory多卡微调的实战教程
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
详解苹果和微软的AI集成策略
当OpenAI在其春季更新会议上宣布推出macOS的ChatGPT桌面应用时,人们不禁疑惑为什么它没有先从Windows开始,毕竟,微软是OpenAI的主要投资者,理应最早获得新ChatGPT功能的访问权限。 现在我们知道原因了,在Build会议上宣布...
-
利用大语言模型增强网络抓取:一种现代化的方法
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文将探讨大语言模型(LLMs 与网络抓取的集成,以及如何利用LLMs高效地将复杂的HTML转换为结构化的JSON。 作为一名数据工程...
-
LLaMA Factory单机微调的实战教程
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
AI大模型探索之路-训练篇25:ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库
系列篇章💥 AI大模型探索之路-训练篇1:大语言模型微调基础认知AI大模型探索之路-训练篇2:大语言模型预训练基础认知AI大模型探索之路-训练篇3:大语言模型全景解读AI大模型探索之路-训练篇4:大语言模型训练数据集概览AI大模型探索之路-训练篇5:大...
-
Meta大佬亲授LLaMA 3的奥秘
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
AI搜索AI浏览器表现亮眼,三六零入选AIGC先锋榜
近日,AICon全球人工智能开发与应用大会暨大模型应用生态展在北京开幕。今年InfoQ再次面向AIGC赛道推出中国技术力量2024之AIGC先锋榜,360集团凭借其优秀创新实践案例上榜“AIGC最 佳实践案例 TOP20”。 “中国技术力量2024之AI...
-
Meta首席科学家:大模型永远达不到人类智力
快科技5月23日消息,据媒体报道,Meta的首席人工智能科学家、深度学习领域的先驱杨立昆(Yann LeCun)近日对ChatGPT等生成式AI产品背后的大语言模型的能力提出了质疑。 他表示,大模型永远无法实现像人类一样的推理和规划能力。 杨立昆明确指出,...
-
拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」
【新智元导读】近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。 辛辛苦苦给大语言模型输入了一大堆提示,它却只记住了开头和结尾? 这个现象叫做LLM的中间迷失(...
-
大模型进入免费时代!百度文心大模型宣布两大主力模型免费用
快科技5月21日消息,今日,百度智能云宣布文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费,即刻生效。 这两款大模型今年3月发布,均支持8K和128k上下文长度。 据了解,ERNIE Lite是百度自研的轻量级大语言模型,兼顾优...
-
拒绝AI生成代码!开源操作系统陆续举起“禁令”,Debian尚无行动
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 当下,AI的崛起已成大势。但是,当AI的触角伸向开源操作系统时,一些社区陆续亮起了“红灯”。 先是Linux发行版Gentoo 在四月中旬发布了一项理事会政策,禁止使用AI工具生成...
-
百度宣布文心大模型ERNIE Speed、ERNIE Lite全面免费
刚刚,百度智能云宣布,文心大模型两大主力模型ERNIE Speed、ERNIE Lite全面免费,立即生效。 据悉,ERNlE Speed是百度2024年最新发布的自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,更好地处理特定场景问题。 而...
-
携手亚马逊云科技,北京灵奥科技助力企业无缝结合大模型与数据
随着生成式AI时代不断发展,越来越多的企业开始关注、应用甚至训练大模型,想要以此创造更大的业务价值。这一想法固然没错,大模型的出现必能为企业带来创新和突破。不过,基础模型依赖于大规模高质量数据集,想要借助生成式AI带来企业差异化优势的关键是企业的专有数据...
-
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
不同于大多数模型使用字母缩略起名,论文作者在脚注中解释道,Lory是一种羽毛有彩虹颜色的鹦鹉,和「软MoE」的精神非常相似。 论文的作者团队也可以称之为「明星阵容」。 论文地址:https://arxiv.org/abs/2405.03133 主要作者...
-
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。 就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。 Falco...
-
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。 别家发布会都在画饼,OpanAI却总能开出一种「欲扬先抑」的效果,惊喜全在发布会之后。 基准测试结果 首先...
-
李彦宏:百度11%的搜索结果都由AI生成
快科技5月17日消息,百度创始人、董事长兼首席执行官李彦宏在2024年第一季度财报电话会议上透露,目前百度搜索结果中已有11%由AI生成。 李彦宏认为,尽管百度搜索的AI重构工作仍处于早期阶段,但搜索服务最有可能成为AI时代的杀手级应用”。 百度在AI领...
-
小米大语言模型MiLM正式通过大模型备案:将应用于汽车、手机、智能家居等产品
快科技5月16日消息,小米官方宣布,小米大语言模型MiLM正式通过大模型备案。 据了解,通过备案后,小米大模型将逐步应用于小米公司的汽车、手机、智能家居等产品中,通过端云结合,既带来单个设备的智能提升,也实现场景内和场景间多设备的协同,为人车家全生态战略赋...
-
WOT大会日程上线:我们找来数十位大模型实践企业现身说法
这两天的技术圈里,估计大家都在摩拳擦掌等待体验OpenAI的GPT-4o(o为Omni缩写,意为“全能”)有多“全能”吧。 我们无意给市场泼冷水,只是要提醒大家,想要让大模型真正落地,市场的热,并不意味着应用实践的成熟。尤其在企业级场景中,为什么大模型落...
-
小米AI大模型MiLM通过备案 将应用于手机、汽车产品中
5月16日,小米公司宣布,小米大语言模型MiLM正式通过大模型备案,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。 5月15日,北京市生成式人工智能服务新增已备案信息正式公布。此次19家企业新增备案,包括了北京小米科技有限责任公司“小米”、腾讯...
-
「大模型」之所短,「知识图谱」之所长
最近一年以来,大语言模型技术突飞猛进,被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来,给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图,其中包括了文本生成、图像生成等技术。本次分享...
-
HPE Aruba Networking的前瞻视角:构建AI赋能的安全融合网络
数字化时代,网络不仅是连接世界的纽带,更是推动商业和社会进步的关键力量。随着移动设备、物联网(IoT 和云服务的爆炸性增长,用户对网络的依赖达到了前所未有的水平。一个能够随时随地提供安全、高效接入的网络环境,无论对个人还是企业,都已成为刚需。然而,这一需...
-
为什么腾讯认为DiT架构是未来的主流?做了哪些改进?
OpenAI迭代ChatGPT的过程,发现随着参数量的提升,基于Transformer 架构的大语言模型出现了涌现现象。因此,在文生图领域,很可能参数量更大的模型,也会更“聪明”。 而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题,且...
-
刚刚,Ilya官宣离职OpenAI,“下一个项目意义重大”
刚刚,久未露面的Ilya Sutskever突然发声! 官宣离开OpenAI,已经有了下一个计划,但目前还不能透露细节。 近十年后,我决定离开OpenAI。 公司的发展轨迹堪称奇迹,我相信,在Sam Altman、Greg Brockman、Mira...