强化学习第8页 - AIGC资讯

chatgpt VS 文心一言使用对比实测

chatgpt VS 文心一言使用对比实测什么是文心一言文心一言（英语：ERNIE Bot）是由百度公司开发的聊天机器人，能够与人交互、回答问题及协作创作。该产品被传媒称为国际著名聊天机器人ChatGPT的中国版及其竞争对手[1][2]。...

生成式AI 2023-11-29 人工智能

894阅读

研究人员发布Starling-7B：基于AI反馈的大语言模型媲美GPT-3.5

UC伯克利的研究人员最近发布了Starling-7B，这是一款基于AI反馈强化学习（RLAIF）的开放式大语言模型(LLM 。该模型基于精调的Openchat3.5，并继承了Mistral-7B的特性。在RLAIF中，研究人员借助其他AI模型的反馈来训练...

AIGC 2023-11-29 人工智能

887阅读

DeepMind发现，AI代理可以通过模仿人类和其他动物进行社会学习

Google DeepMind的机器学习研究团队最近宣布，他们成功证明了人工智能（AI）代理可以通过社会学习的方式获取技能，类似于人类和其他动物的学习过程。这一成果被认为是在人工智能领域的重大突破，为实现人工通用智能迈出了一步。研究团队由Google D...

AIGC 2023-11-29 人工智能

827阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1493阅读

人工智能十大基础术语

这里有10个关键的术语，每个人工智能爱好者都应该知道并了解。人工智能(AI 已经成为各行各业的变革力量，塑造了我们与技术和周围世界互动的方式。对于那些深入人工智能领域的人而言，理解基础术语至关重要。 1、人工智能(AI ：人工智能的核心是指开发能够执...

大数据 2023-11-29 人工智能

858阅读

谷歌 DeepMind 团队研究显示 AI 能够通过社会学习过程获得技能

谷歌 DeepMind 的机器学习研究团队声称，他们已经证明人工智能可以通过类似于人类和其他动物的社会学习过程来获取技能。社会学习——即一个个体通过模仿另一个个体来获取技能和知识——对于人类以及大部分动物界的发展过程至关重要。DeepMind 团队声称...

人工智能 2023-11-29 人工智能

806阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

1256阅读

大模型之Bloom&LLAMA----RHLF(强化学习)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

大数据 2023-11-28 人工智能

951阅读

谷歌：LLM找不到推理错误，但能纠正它

今年，大型语言模型（LLM）成为 AI 领域关注的焦点。LLM 在各种自然语言处理（NLP）任务上取得了显著的进展，在推理方面的突破尤其令人惊艳。但在复杂的推理任务上，LLM 的表现仍然欠佳。那么，LLM 能否判断出自己的推理存在错误？最近，剑桥大学和...

人工智能 2023-11-27 人工智能

779阅读

OpenAI宫斗剧引出神秘项目Q*

Q* “出局-跳槽-返岗”，5天之后，Sam Altman最终重新拿回CEO一职，与力挺他的原董事会主席Greg Brockman一同回到了OpenAI。当人们以为这家AI巨头上演的宫斗剧彻底落下帷幕时，路透社甩出一个大瓜:在Altman被罢免之前，Op...

AIGC 2023-11-27 人工智能

838阅读

看百度文心一言实力，再聊ChatGPT触类旁通的学习能力如何而来？

图文原创：亲爱的数据美国大模型水平领先，国内大模型蓄势而发。国内大模型参与者众多，百度文心一言第一个有勇气站出来发布。此处应有掌声。事前事后，中国网友的呐喊声不绝于耳：“文心一言到底什么水平啊？” 其实网友更想知道：国内A...

生成式AI 2023-11-27 人工智能

877阅读

每日学术速递1.30

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理更多Ai资讯：今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...

生成式AI 2023-11-26 人工智能

846阅读

今日思考（2） — 训练机器学习模型用GPU还是NUP更有优势（基于文心一言的回答）

前言深度学习用GPU，强化学习用NPU。 1.训练深度学习模型，强化学习模型用NPU还是GPU更有优势在训练深度学习模型时，GPU相比NPU有优势。GPU拥有更高的访存速度和更高的浮点运算能力，因此更适合深度学...

大数据 2023-11-26 人工智能

1737阅读

2 天：我用文字 AI-ChatGPT 写了绘画 AI-Stable Diffusion 跨平台绘画应用

文本 AI - ChatGPT 和绘画 AI - Stable Diffusion，平地惊雷，突然进入寻常百姓家。如果时间可以快进，未来的人们对于我们这段时光的历史评价，大概会说：当时的人们在短时间连续经历了这几种情感。从不信，去试试看；到远超预期...

生成式AI 2023-11-25 人工智能

1001阅读

OpenAI神秘Q毁灭人类？爆火「Q假说」竟牵出世界模型，全网AI大佬长文热议

Q* 【新智元导读】传闻中OpenAI的Q*，已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文，猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI，已是临门一脚了? Ope...

人工智能 2023-11-25 人工智能

831阅读

PBT集团表示，数据质量对训练ChatGPT至关重要

距离OpenAI向公众发布ChatGPT已经接近一年，其采纳率呈现了前所未有的飙升。截至2023年2月，据路透社报道，ChatGPT拥有大约1亿活跃用户。快进到9月，ChatGPT网站吸引了近15亿访问者，展示了该平台在当今数字领域中的巨大流行和重要作用。...

大数据 2023-11-24 人工智能

866阅读

LLaMA-2论文阅读

1. 基本介绍 LLaMA-2是2023年7月24日Meta发布的LLaMA第二代，跟LLaMA-1几个显著区别: 免费可商用版本的大模型 context上下文增加了一倍，从2K变为了4K 训练的总token数从1.0T/1.4T增加为2.0T(...

生成式AI 2023-11-24 人工智能

1164阅读

能总结经验、持续进化，上交把智能体优化参数的成本打下来了

大模型的出现引发了智能体设计的革命性变革，在 ChatGPT 及其插件系统问世后，对大模型智能体的设计和开发吸引了极大的关注。帮助完成预订、下单等任务，协助编写文案，自主从网络上搜索最新的知识与新闻等等，这种通用、强大的智能助理，让大模型强大的语义理解、...

人工智能 2023-11-24 人工智能

821阅读

OpenAI神秘新模型Q*曝光，太强大让董事会警惕，或是奥特曼被开除导火索

OpenAI宫斗大戏刚刚落幕，马上又掀起另一场轩然大波！路透社曝光，在奥特曼被解雇之前，几位研究人员给董事会写的警告信可能是整个事件导火索：内部名为Q （发音为Q-Star）*的下一代AI模型，过于强大和先进，可能会威胁人类。 Q*正是由这场风暴的中...

AIGC 2023-11-24 人工智能

743阅读

淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA

9月12日，淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA，旨在让技术开发者们能够更方便地提升大语言模型训练性能，降低训练成本，并保持和LLaMA社区的兼容性。测试显示，在32卡训练上，相比HuggingFace上直接获得的...

生成式AI 2023-11-24 人工智能

925阅读

边缘智能：实现实时数据处理和智能决策的新一代技术

Labs 导读边缘智能（Edge Intelligence）是一种将人工智能（AI）和边缘计算相结合的新兴技术。传统的人工智能应用通常依赖于云计算中心进行数据处理和决策，但这种方式存在延迟和网络带宽的问题。 Part 01、什么是边缘智能 ...

人工智能 2023-11-23 人工智能

982阅读

腾讯披露最新大模型训练方法，可节省50%算力成本

在算力紧缺的背景下，如何提升大模型训练和推理的效率，并降低成本，成为业界关注的焦点。 11月23日，腾讯披露，腾讯混元大模型背后的自研机器学习框架Angel再次升级，大模型训练效率提升至主流开源框架的2.6倍，千亿级大模型训练可节省50%算力成本。升级后...

人工智能 2023-11-23 人工智能

892阅读

OpenAI 秘密研究 Q*，离 AGI 又近了一步

Q* 近期报道揭示了OpenAI正在进行的秘密研究项目，名为 Q*，这被认为是迈向通用人工智能（AGI）的一项重大进步。该项目由OpenAI的首席科学家Ilya Sutskevar以及其他杰出的研究人员，如Jakub Pachocki和Szymon Sid...

人工智能 2023-11-23 人工智能

906阅读

Llama 2：开放基础和微调聊天模型

介绍大型语言模型(llm 作为高能力的人工智能助手，在复杂的推理任务中表现出色，这些任务需要广泛领域的专家知识，包括编程和创意写作等专业领域。它们可以通过直观的聊天界面与人类进行交互，这在公众中得到了迅速而广泛的采用。法学硕士的能力是显著的考虑到训...

AIGC 2023-11-23 人工智能

850阅读

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Stable Diffusion官方终于对视频下手了—— 发布生成式视频模型Stable Video Diffusion（SVD）。 Stability AI官方博客显示，全新SVD支持文本到视频、图像到视频生成：并且还支持物体从单一视角到多视角的...

人工智能 2023-11-22 人工智能

887阅读

ChatGPT 使用到的机器学习技术

作者 | Bright Liao 在《程序员眼中的 ChatGPT》一文中，我们聊到了开发人员对于ChatGPT的认知。本文来聊一聊ChatGPT用到的机器学习技术。机器学习技术的发展要聊ChatGPT用到的机器学习技术，我们不得不回顾一下机器学...

生成式AI 2023-11-22 人工智能

892阅读

为什么知识管理是 AI 成功的基础？

为 AI 提供正确的上下文可以提高准确性并减少幻觉。在所有关于人工智能如何彻底改变工作（使日常任务更高效、更可重复，并增加个人努力）的对话中，人们很容易得意忘形：人工智能不能做什么？尽管它的名字叫生成式人工智能，但能够创建图像、代码、文本、音乐...

人工智能 2023-11-21 人工智能

939阅读

基于llama模型进行增量预训练

目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...

生成式AI 2023-11-21 人工智能

1292阅读

深入理解LLaMA, Alpaca, ColossalChat 系列模型

知乎：紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca：大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...

AIGC 2023-11-21 人工智能

988阅读

中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT

中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型（LLM）。该模型基于封神榜团队的 Ziya2-13B 模型构建，拥有130亿个参数，并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...

生成式AI 2023-11-20 人工智能

882阅读

【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」

ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案中...

AIGC 2023-11-20 人工智能

1854阅读

一文读懂 AI Agents 技术

想象一下：软件实体能够自主地与环境交互，根据收集的数据做出决策，并以最少的人为干预执行基于特定场景。幸好，借助 AI Agents 技术，这个现实比你想象的更接近了。这些智能代理正在彻底改变行业，并改变我们的生活方式。但是，大家可能会好奇：AI Agen...

AIGC 2023-11-20 人工智能

860阅读

谷歌为什么输给了OpenAI？科技公司创始人兼谷歌前员工带你一探究竟

在当今的人工智能浪潮中，OpenAI这样的新兴公司引领了革命。 ——而GPT的一些关键部分：Transformer、强化学习（AlphaGo ）和多模态（Flamingo）却都是由Google发明的。那么为什么，作为科技领域巨无霸的Google，却...

大数据 2023-11-20 人工智能

942阅读

Nature：大模型只会搞角色扮演，并不真正具有自我意识

大模型正变得越来越“像人”，但事实真是如此吗？现在，一篇发表Nature上的文章，直接否决了这个观点——所有大模型，都不过是在玩角色扮演而已！无论是GPT-4、PaLM、Llama 2还是其他大模型，在人前表现得彬彬有礼、知书达理的样子，其实都只是...

大数据 2023-11-20 人工智能

801阅读

BeautifulPrompt：PAI 推出自研 Prompt 美化器，赋能 AIGC一键出美图

背景 Stable Diffusion（SD）是一种流行的AI生成内容（AI Generated Content，AIGC）模型，能在文字输入的基础上生成各种风格多样的图像。在目前的AIGC方向，SD是开源社区最热门的模型。然而，SD能够生成高颜值的图像...

大数据 2023-11-19 人工智能

818阅读

AIGC浪潮席卷，亚马逊云科技携手海尔设计、Nolibox加速工业设计转型

从机器学习算法到深度学习再到强化学习，AI创新浪潮奔流不息。而AIGC（AI-generated Content，人工智能生成内容）的到来，更是让AI成为众多企业的得力助手，开拓了文本、图像、音视频等领域的天花板。在洞悉到AIGC技术广阔的应用空间和无...

人工智能 2023-11-18 人工智能

912阅读

chatgpt平替，清华chatglm本地化部署教程（aigc大模型风口，校招找工作必备），包含weiui部署，api部署，对话框部署

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。...

AIGC 2023-11-18 人工智能

1265阅读

一文盘点2023人工智能进展，不止大模型而已

2023年大模型千帆竞发，除此外AI领域还有哪些新突破？来来来，畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。看完才知道： RLHF今年虽然爆火，但实打实用到的模型并不多，现在还出现了替代方案，有望从开...

AIGC 2023-11-16 人工智能

919阅读

【2023云栖】黄博远：阿里云人工智能平台PAI年度发布

本文根据2023云栖大会演讲实录整理而成，演讲信息如下：演讲人：黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人演讲主题：阿里云人工智能平台PAI年度发布 AIGC是我们这个时代的新机遇今年云栖大会，阿里云机器...

大数据 2023-11-16 人工智能

954阅读

OPPO明日将发千亿参数安第斯大模型：对话能力获提升

快科技11月15日消息，据媒体报道，OPPO将于明日发布个人专属、对话增强的安第斯大模型（AndesGPT），这是基于千亿参数的对话增强语言模型。 OPPO明日将会在上海世博中心举行OPPO开发者大会，正式发布ColorOS 14，与之同台登场的还有And...

生成式AI 2023-11-16 人工智能

773阅读

北大全新「机械手」算法：辅助花式抓杯子，GTX 1650实现150fps推断

手是人类与世界交互的重要部分，手的缺失（如上肢残障）会大大影响人类的正常生活。北京大学董豪团队通过将扩散模型和强化学习结合，使机械手能根据人手腕部的移动轨迹，自适应的抓取物体的不同部位，满足人类多样化的抓取需求，目前该工作已被NeurIPS 2023接...

人工智能 2023-11-15 人工智能

871阅读

微软推出 XOT 方法，提升语言模型推理能力

11 月 15 日消息，微软近日推出了名为“Everything of Thought”（XOT）的方法，灵感来自谷歌 DeepMind 的 AlphaZero，利用紧凑的神经网络，来增强 AI 模型推理能力。微软和佐治亚理工学院、华东师范大学...

AIGC 2023-11-15 人工智能

733阅读

LLM幻觉问题全梳理！哈工大团队50页综述重磅发布

幻觉，老朋友了。自打LLM进入我们的视野，幻觉问题就一直是一道坎，困扰着无数开发人员。当然，有关大语言模型幻觉的问题已经有了无数研究。最近，来自哈工大和华为的团队发表了一篇50页的大综述，对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。这...

AIGC 2023-11-15 人工智能

781阅读

企业对生成式AI的投资低得惊人在云支出中占比不到1%

2023年，生成式AI备受关注，被认为是能够在多个领域实现变革的突破性技术，甚至被寄予改变人类生活的希望。然而，Menlo Ventures报告显示，尽管生成式AI在2023年取得突破，但这主要是一场炒作。报告指出，生成式AI在企业云支出中所占比例“相对...

人工智能 2023-11-14 人工智能

798阅读

腾讯云部署清华大学ChatGLM-6B实战

简介（来自官方） ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只...

生成式AI 2023-11-14 人工智能

957阅读

LLaMA系列 | LLaMA和LLaMA-2精简总结

文章目录 1、LLaMA 1.1、模型结构 1.2、训练方式 1.3、结论 2、LLaMA-2 2.1、相比LLaMA1的升级 2.3、模型结构 2.3.1、MHA, MQA, GQA区别与联系 2.4、训练方式 1、L...

人工智能 2023-11-13 人工智能

1349阅读

2028年人类将迎来AGI：DeepMind联合创始人长文预测未来AI发展

10月26日，在X上有三万订阅的Dwarkesh Podcast（矮人播客）主持人Dwarkesh Patel采访了谷歌DeepMind的创始人兼首席AGI科学家Shane Legg。他们讨论了AGI出现的时间节点、可能的AGI新架构、作为下一个行业标...

人工智能 2023-11-13 人工智能

807阅读

斯坦福提出对比偏好学习：无需强化学习即可从人类反馈中学习

在模型与人类意图对齐方面，根据人类反馈的强化学习（RLHF）已经成为一大流行范式。通常来说，RLHF 算法的工作过程分为两个阶段：一、使用人类偏好学习一个奖励函数；二、通过使用强化学习优化所学习的奖励来对齐模型。 RLHF 范式假定人类偏好的分布遵照奖励...

生成式AI 2023-11-13 人工智能

938阅读

百度智能云“千帆大模型平台”最新升级：接入Llama 2等33个模型！

今年3月，百度智能云推出“千帆大模型平台”。作为全球首个一站式的企业级大模型平台，千帆不但提供包括文心一言在内的大模型服务及第三方大模型服务，还提供大模型开发和应用的整套工具链，能够帮助企业解决大模型开发和应用过程中的所有问题。本次千帆大模型平台升级的...

人工智能 2023-11-12 人工智能

954阅读

摸着OpenAI过河，百度文心一言能否“重拳出击”？

“文心一言”对标ChatGPT，饱含争议。文心一言作为一款语言大模型，并提出了自己在技术对就业的影响方面的理解，现阶段正处于摸着OpenAI过河的时候，路该如何走？ GPT-4太惊艳，压力给到文心一言这段时间，GPT-4和文心一言前后脚和大家...

生成式AI 2023-11-11 人工智能

793阅读