-
今日思考(1) — 算力对机器人的影响(基于文心一言的回答)
目录 1.高tops的算力能支持什么水平的复合机器人控制 2.什么情况下控制机器人需要更高的算力 3.为什么使用人工智能算法,例如深度学习、强化学习等,需要更多的计算资源来实现更精准的决策和控制。 4.将已经训练好的人工智能算法模型,例...
-
【赠书第10期】从概念到现实:ChatGPT和Midjourney的设计之旅
文章目录 前言 1 ChatGPT的崛起 2 Midjourney的探索 3 技术创新的交汇 4 对未来的影响 5 结论 6 推荐图书 7 粉丝福利 前言 在过去的几年里,自然语言处理和聊天模型的领域取得了飞速的发展。ChatGPT...
-
【人工智能】AI写作能力大比拼:《人工智能的数学基础》写下这本书的目录。
文心一言:《人工智能的数学基础》写下这本书的目录。 《人工智能的数学基础》 第一章 人工智能与数学基础 1.1 人工智能简介 1.2 数学在人工智能中的作用 1.3 本书内容概述 第二章 线性代数基础 2.1 向量与矩阵 2.2 行列式与...
-
人工智能的博弈论——初探智能体(Agents)与人、智能体和环境之间的博弈关系
人工智能(AI)是研究如何使计算机和机器具有智能行为的学科,它涉及到多个领域和应用,如机器学习、深度学习、自然语言处理、计算机视觉、机器人、自动驾驶等。人工智能的发展和应用,不仅给人类带来了便利和效率,也带来了挑战和风险,如数据安全、隐私保护、伦理道德、...
-
微软亚洲研究院韦福如:人工智能基础创新的第二增长曲线
从人工智能的发展历程来看,GPT 系列模型(例如 ChatGPT 和 GPT-4)的问世无疑是一个重要的里程碑。由它所驱动的人工智能应用已经展现出高度的通用性和可用性,并且能够覆盖多个场景和行业 —— 这在人工智能的历史上前所未有。 然而,人工智能的科研...
-
AI进化史之“技术兵分两路“
1. 前文回顾上一篇我们讲到了AI历史上的两位开创人物: Marvin Minsky:发明了世界上第一个强化学习神经网络SNARC Frank Rosenblatt:发明了世界上第一台感知器(Perceptron)实现AI历史上最初级的图像识别。 Mar...
-
百度CTO王海峰:全栈AI技术加持,打造新一代大语言模型文心一言
3月16日,百度在北京总部召开新闻发布会,百度创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰出席,李彦宏展示了新一代知识增强大语言模型文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五个使用场景中的综合能力,王海峰解读了文心一言...
-
使用 RLHF 训练 LLaMA 的实践指南:StackLLaMA
由于LLaMA没有使用RLHF,后来有一个初创公司 Nebuly AI使用LangChain agent生成的数据集对LLaMA模型使用了RLHF进行学习,得到了ChatLLaMA模型,详情请参考:Meta开源的LLaMA性能真如论文所述吗?如果增加RLH...
-
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合预演“下个浪潮”
收集整理|小鱼 新的AI题材层出不穷,这次轮到“机器人+AI"融合而成的具身智能概念。 “硅谷钢铁侠"马斯克和热爱黑色皮衣的"显卡教父”黄仁勋均作出积极表态,可谓不谋而合。 当地时间5月16日,特斯拉2023年年度股东大会召开,马斯克在会,...
-
chatgpt VS 文心一言使用对比实测
chatgpt VS 文心一言使用对比实测 什么是文心一言 文心一言(英语:ERNIE Bot)是由百度公司开发的聊天机器人,能够与人交互、回答问题及协作创作。该产品被传媒称为国际著名聊天机器人ChatGPT的中国版及其竞争对手[1][2]。...
-
研究人员发布Starling-7B:基于AI反馈的大语言模型 媲美GPT-3.5
UC伯克利的研究人员最近发布了Starling-7B,这是一款基于AI反馈强化学习(RLAIF)的开放式大语言模型(LLM 。该模型基于精调的Openchat3.5,并继承了Mistral-7B的特性。 在RLAIF中,研究人员借助其他AI模型的反馈来训练...
-
DeepMind发现,AI代理可以通过模仿人类和其他动物进行社会学习
Google DeepMind的机器学习研究团队最近宣布,他们成功证明了人工智能(AI)代理可以通过社会学习的方式获取技能,类似于人类和其他动物的学习过程。这一成果被认为是在人工智能领域的重大突破,为实现人工通用智能迈出了一步。 研究团队由Google D...
-
【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍!
Llama 2 发布! Meta 刚刚发布了 LLaMa 2,它是 LLaMA 的下一代版本,具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸:7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构,并且是...
-
人工智能十大基础术语
这里有10个关键的术语,每个人工智能爱好者都应该知道并了解。 人工智能(AI 已经成为各行各业的变革力量,塑造了我们与技术和周围世界互动的方式。对于那些深入人工智能领域的人而言,理解基础术语至关重要。 1、人工智能(AI :人工智能的核心是指开发能够执...
-
谷歌 DeepMind 团队研究显示 AI 能够通过社会学习过程获得技能
谷歌 DeepMind 的机器学习研究团队声称,他们已经证明人工智能可以通过类似于人类和其他动物的社会学习过程来获取技能。 社会学习——即一个个体通过模仿另一个个体来获取技能和知识——对于人类以及大部分动物界的发展过程至关重要。DeepMind 团队声称...
-
Llama-Factory的baichuan2微调
Llama-Factory:https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。 默认模块应作...
-
大模型之Bloom&LLAMA----RHLF(强化学习)
0. 简介 随着chatgpt的爆火,最近也有很多大模型在不断地出现,比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说,更加具有发展前景,因为其是完全可商用,并可以不断迭代更新的。最近作者在跟着h...
-
谷歌:LLM找不到推理错误,但能纠正它
今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得了显著的进展,在推理方面的突破尤其令人惊艳。但在复杂的推理任务上,LLM 的表现仍然欠佳。 那么,LLM 能否判断出自己的推理存在错误?最近,剑桥大学和...
-
OpenAI宫斗剧引出神秘项目Q*
Q* “出局-跳槽-返岗”,5天之后,Sam Altman最终重新拿回CEO一职,与力挺他的原董事会主席Greg Brockman一同回到了OpenAI。 当人们以为这家AI巨头上演的宫斗剧彻底落下帷幕时,路透社甩出一个大瓜:在Altman被罢免之前,Op...
-
看百度文心一言实力,再聊ChatGPT触类旁通的学习能力如何而来?
图文原创:亲爱的数据 美国大模型水平领先,国内大模型蓄势而发。 国内大模型参与者众多,百度文心一言第一个有勇气站出来发布。 此处应有掌声。 事前事后,中国网友的呐喊声不绝于耳:“文心一言到底什么水平啊?” 其实网友更想知道:国内A...
-
每日学术速递1.30
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 更多Ai资讯: 今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...
-
今日思考(2) — 训练机器学习模型用GPU还是NUP更有优势(基于文心一言的回答)
前言 深度学习用GPU,强化学习用NPU。 1.训练深度学习模型,强化学习模型用NPU还是GPU更有优势 在训练深度学习模型时,GPU相比NPU有优势。GPU拥有更高的访存速度和更高的浮点运算能力,因此更适合深度学...
-
2 天:我用文字 AI-ChatGPT 写了绘画 AI-Stable Diffusion 跨平台绘画应用
文本 AI - ChatGPT 和绘画 AI - Stable Diffusion,平地惊雷,突然进入寻常百姓家。 如果时间可以快进,未来的人们对于我们这段时光的历史评价,大概会说: 当时的人们在短时间连续经历了这几种情感。从不信,去试试看;到远超预期...
-
OpenAI神秘Q*毁灭人类?爆火「Q*假说」竟牵出世界模型,全网AI大佬长文热议
Q* 【新智元导读】传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文,猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI,已是临门一脚了? Ope...
-
PBT集团表示,数据质量对训练ChatGPT至关重要
距离OpenAI向公众发布ChatGPT已经接近一年,其采纳率呈现了前所未有的飙升。截至2023年2月,据路透社报道,ChatGPT拥有大约1亿活跃用户。快进到9月,ChatGPT网站吸引了近15亿访问者,展示了该平台在当今数字领域中的巨大流行和重要作用。...
-
LLaMA-2论文阅读
1. 基本介绍 LLaMA-2是2023年7月24日Meta发布的LLaMA第二代,跟LLaMA-1几个显著区别: 免费可商用版本的大模型 context上下文增加了一倍,从2K变为了4K 训练的总token数从1.0T/1.4T增加为2.0T(...
-
能总结经验、持续进化,上交把智能体优化参数的成本打下来了
大模型的出现引发了智能体设计的革命性变革,在 ChatGPT 及其插件系统问世后,对大模型智能体的设计和开发吸引了极大的关注。帮助完成预订、下单等任务,协助编写文案,自主从网络上搜索最新的知识与新闻等等,这种通用、强大的智能助理,让大模型强大的语义理解、...
-
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索
OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波! 路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索: 内部名为Q (发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。 Q*正是由这场风暴的中...
-
淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并保持和LLaMA社区的兼容性。测试显示,在32卡训练上,相比HuggingFace上直接获得的...
-
边缘智能:实现实时数据处理和智能决策的新一代技术
Labs 导读 边缘智能(Edge Intelligence)是一种将人工智能(AI)和边缘计算相结合的新兴技术。传统的人工智能应用通常依赖于云计算中心进行数据处理和决策,但这种方式存在延迟和网络带宽的问题。 Part 01、 什么是边缘智能 ...
-
腾讯披露最新大模型训练方法,可节省50%算力成本
在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本,成为业界关注的焦点。 11月23日,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级,大模型训练效率提升至主流开源框架的2.6倍,千亿级大模型训练可节省50%算力成本。升级后...
-
OpenAI 秘密研究 Q*,离 AGI 又近了一步
Q* 近期报道揭示了OpenAI正在进行的秘密研究项目,名为 Q*,这被认为是迈向通用人工智能(AGI)的一项重大进步。该项目由OpenAI的首席科学家Ilya Sutskevar以及其他杰出的研究人员,如Jakub Pachocki和Szymon Sid...
-
Llama 2:开放基础和微调聊天模型
介绍 大型语言模型(llm 作为高能力的人工智能助手,在复杂的推理任务中表现出色,这些任务需要广泛领域的专家知识,包括编程和创意写作等专业领域。它们可以通过直观的聊天界面与人类进行交互,这在公众中得到了迅速而广泛的采用。 法学硕士的能力是显著的考虑到训...
-
Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快
Stable Diffusion官方终于对视频下手了—— 发布生成式视频模型Stable Video Diffusion(SVD)。 Stability AI官方博客显示,全新SVD支持文本到视频、图像到视频生成: 并且还支持物体从单一视角到多视角的...
-
ChatGPT 使用到的机器学习技术
作者 | Bright Liao 在《程序员眼中的 ChatGPT》一文中,我们聊到了开发人员对于ChatGPT的认知。本文来聊一聊ChatGPT用到的机器学习技术。 机器学习技术的发展 要聊ChatGPT用到的机器学习技术,我们不得不回顾一下机器学...
-
为什么知识管理是 AI 成功的基础?
为 AI 提供正确的上下文可以提高准确 性并减少幻觉。 在所有关于人工智能如何彻底改变工作(使日常任务更高效、更可重复,并增加个人努力)的对话中,人们很容易得意忘形:人工智能不能做什么? 尽管它的名字叫生成式人工智能,但能够创建图像、代码、文本、音乐...
-
基于llama模型进行增量预训练
目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...
-
深入理解LLaMA, Alpaca, ColossalChat 系列模型
知乎:紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca:大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...
-
中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT
中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型(LLM)。该模型基于封神榜团队的 Ziya2-13B 模型构建,拥有130亿个参数,并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...
-
【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」
ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案 中...
-
一文读懂 AI Agents 技术
想象一下:软件实体能够自主地与环境交互,根据收集的数据做出决策,并以最少的人为干预执行基于特定场景。幸好,借助 AI Agents 技术,这个现实比你想象的更接近了。这些智能代理正在彻底改变行业,并改变我们的生活方式。但是,大家可能会好奇:AI Agen...
-
谷歌为什么输给了OpenAI?科技公司创始人兼谷歌前员工带你一探究竟
在当今的人工智能浪潮中,OpenAI这样的新兴公司引领了革命。 ——而GPT的一些关键部分:Transformer、强化学习(AlphaGo ) 和 多模态(Flamingo)却都是由Google发明的。 那么为什么,作为科技领域巨无霸的Google,却...
-
Nature:大模型只会搞角色扮演,并不真正具有自我意识
大模型正变得越来越“像人”,但事实真是如此吗? 现在,一篇发表Nature上的文章,直接否决了这个观点——所有大模型,都不过是在玩角色扮演而已! 无论是GPT-4、PaLM、Llama 2还是其他大模型,在人前表现得彬彬有礼、知书达理的样子,其实都只是...
-
BeautifulPrompt:PAI 推出自研 Prompt 美化器,赋能 AIGC一键出美图
背景 Stable Diffusion(SD)是一种流行的AI生成内容(AI Generated Content,AIGC)模型,能在文字输入的基础上生成各种风格多样的图像。在目前的AIGC方向,SD是开源社区最热门的模型。然而,SD能够生成高颜值的图像...
-
AIGC浪潮席卷,亚马逊云科技携手海尔设计、Nolibox加速工业设计转型
从机器学习算法到深度学习再到强化学习,AI创新浪潮奔流不息。而AIGC(AI-generated Content,人工智能生成内容)的到来,更是让AI成为众多企业的得力助手,开拓了文本、图像、音视频等领域的天花板。 在洞悉到AIGC技术广阔的应用空间和无...
-
chatgpt平替,清华chatglm本地化部署教程(aigc大模型风口,校招找工作必备),包含weiui部署,api部署,对话框部署
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。...
-
一文盘点2023人工智能进展,不止大模型而已
2023年大模型千帆竞发,除此外AI领域还有哪些新突破? 来来来,畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。 看完才知道: RLHF今年虽然爆火,但实打实用到的模型并不多,现在还出现了替代方案,有望从开...
-
【2023云栖】黄博远:阿里云人工智能平台PAI年度发布
本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人 演讲主题:阿里云人工智能平台PAI年度发布 AIGC是我们这个时代的新机遇 今年云栖大会,阿里云机器...
-
OPPO明日将发千亿参数安第斯大模型:对话能力获提升
快科技11月15日消息,据媒体报道,OPPO将于明日发布个人专属、对话增强的安第斯大模型(AndesGPT),这是基于千亿参数的对话增强语言模型。 OPPO明日将会在上海世博中心举行OPPO开发者大会,正式发布ColorOS 14,与之同台登场的还有And...
-
北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断
手是人类与世界交互的重要部分,手的缺失(如上肢残障)会大大影响人类的正常生活。 北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS 2023接...