大模型第94页 - AIGC资讯

中文大语言模型 Llama-2 7B（或13B）本地化部署（国内云服务器、GPU单卡16GB、中文模型、WEB页面TextUI、简单入门）

本文目的是让大家先熟悉模型的部署，简单入门；所以只需要很小的算力，单台服务器单GPU显卡（显存不低于12GB），操作系统需要安装 Ubuntu 18.04。 1 服务器&操作系统 1.1服务器的准备...

生成式AI 2023-11-08 人工智能

1472阅读

深度解析 Llama 2 的资源汇总：不容错过

“ 探索 Llama 2 背后的过程，包括了模型的全面解析，在线体验，微调，部署等，这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后，不少朋...

人工智能 2023-11-08 人工智能

1016阅读

IoT与鸿蒙、低代码、生成式AI，引爆技术浪潮——华为云开发者日南京站成功举办

本文分享自华为云社区《IoT与鸿蒙、低代码、生成式AI，引爆技术浪潮——华为云开发者日南京站成功举办》，作者：华为云社区精选。近日，华为云开发者日HDC.Cloud Day南京站成功举行，开发者不仅聆听了华为云技术专家IoT与鸿蒙的结合，低代码，生成...

生成式AI 2023-11-08 人工智能

860阅读

从科幻走向现实，LLM Agent 做到哪一步了？

LLM 洪流滚滚，AI 浪潮席卷全球，在这不断冲击行业认知的一年中，Agent 以冉冉新星之态引起开发者侧目。OpenAI 科学家 Andrej Karpathy 曾言“OpenAI 在大模型领域快人一步，但在 Agent 领域，却是和大家处在同一起跑线上...

AIGC 2023-11-08 人工智能

972阅读

万字长文解读Stable Diffusion的核心插件—ControlNet

目录一、介绍二、使用方法三、ControlNet结构 1.整体结构 2.ControlLDM 3.Timestep Embedding 4.HintBlock 5.ResBlock 6.SpatialTransformer 7.S...

人工智能 2023-11-08 人工智能

2100阅读

MoE：LLM终身学习的可能性

性质说明知识记忆（knowledge retention） √ LLM预训练后，具备世界知识，小规模finetune不易对LLM造成遗忘灾难。但大规模数据续训会造成。前向迁移（forward...

大数据 2023-11-08 人工智能

958阅读

文生图大型实践：揭秘百度搜索AIGC绘画工具的背后故事！

作者 | Tianbao 导读 2023年以来，AIGC技术已催生了新一轮人工智能浪潮。AI绘画作为大模型最引人瞩目的应用领域之一，近年来也取得了重大突破。AI绘画系统可以根据用户的输入或提示生成各种风格的图像，这为艺术家、设计师和创作者提供...

AIGC 2023-11-08 人工智能

863阅读

文心一言Plugin实战来了，测试开发旅游攻略助手

刚刚过去的8月，百度WAVE SUMMIT 深度学习开发者大会上，重磅发布文心一言的五个原生插件：百度搜索、览卷文档（基于文档的交互）、E 言易图（数据洞察图表生成）、说图解画（基于图片的交互）、一镜流影（文字转视频）。我们知道大模型的训练过程一般...

人工智能 2023-11-08 人工智能

993阅读

实测文心一言4.0，真的比GPT-4毫不逊色吗？

10月17日，李彦宏在百度世界2023上表示。当天，李彦宏以《手把手教你做AI原生应用》为主题发表演讲，发布文心大模型4.0版本。今天，咱们就开门见山啊。这一回要测一测，昨天才发布的文心一言大模型 4.0。之所以要测它，是因为李彦宏昨天在会上说的那...

AIGC 2023-11-08 人工智能

835阅读

让大模型分析csdn文章质量 —— 提取csdn博客评论在文心一言分析评论区内容

文章目录 ⭐前言 ⭐技术栈选择 ⭐前端页面搭建 ⭐后端获取数据暴露接口 ?requests获取数据 ? django 抛出api 接口 ⭐效果 ⭐结束 ⭐前言大家好，我是yma16，本文分享关于让大模型分析csdn文章质量...

AIGC 2023-11-08 人工智能

913阅读

万万没想到，我用文心一言开发了一个儿童小玩具

最近关注到一年一度的百度世界大会今年将于10月17日在北京首钢园举办，本期大会的主题是“生成未来（PROMPT THE WORLD）”。会上，李彦宏会做主题为「手把手教你做AI原生应用」的演讲，比较期待 Robin 会怎么展示。据说，大会当天百度还会发布文...

人工智能 2023-11-08 人工智能

912阅读

DeepMind指出「Transformer无法超出预训练数据实现泛化」，但有人投来质疑

距离马斯克的 xAI 公布 Grok 才过去一天，刚刚，xAI 又公布了另一款 AI 产品，一个可用于 prompt 工程和可解释性研究的集成开发环境：PromptIDE。接连不断的新品发布，也让网友纷纷感叹：「xAI 团队的开发速度简直是疯了！」...

人工智能 2023-11-08 人工智能

807阅读

如何高效训练？综述汇总：大型深度学习训练的并行分布式系统

本文经自动驾驶之心公众号授权转载，转载请联系出处。 23年1月论文“Systems for Parallel and Distributed Large-Model Deep Learning Training“，来自UCSD。深度学习（DL）已经...

AIGC 2023-11-08 人工智能

908阅读

思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0

思谋科技在第六届中国国际进口博览会上发布了全球首个工业多模态大模型 IndustryGPT V1.0。这个大模型通过深度的行业洞察和海量的精炼数据，能够准确回答制造业的问题、识别工业缺陷，并提供决策支持。与此同时，思谋科技还与松下、江森自控等跨国企业...

AIGC 2023-11-08 人工智能

805阅读

寒武纪与百川智能完成大模型适配

据寒武纪科技官方消息，近日，寒武纪思元（MLU）系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配。寒武纪的思元（MLU）云端智能加速卡支持多种数据位宽、超大内存容量和...

AIGC 2023-11-08 人工智能

803阅读

你知道程序员再过几年会没落？

《Computer World》杂志曾经写过一篇文章，说“编程到1960年就会消失”，因为IBM开发了一种新语言FORTRAN，这种新语言可以让工程师写出他们所需的数学公式，然后提交给计算机运行，所以编程就会终结。图片又过了几年，我们听到了一种新...

人工智能 2023-11-08 人工智能

881阅读

百度智能云千帆大模型平台推出千帆SDK开源版本

百度智能云千帆大模型平台再次升级，推出千帆 SDK，全面开源并免费下载使用。该 SDK 提供了从数据集管理、模型训练、模型评估到服务部署等一系列功能，用户可以通过代码接入并调用百度智能云千帆大模型平台的能力，轻松实现 LLMOps 全流程的落地，快速构建...

AIGC 2023-11-08 人工智能

830阅读

马斯克版ChatGPT背后开发工具上线！xAI产品两连发，网友：交付速度太疯狂

马斯克版ChatGPT才刚吸引一波眼球，xAI第二款大模型产品就突然登场了！就在刚刚，马斯克旗下xAI官宣：推出PromptIDE。一个用于提示工程和可解释性研究的集成开发环境。 xAI表示，他们打造PromptIDE的最初目的，是加速其聊天AI机...

人工智能 2023-11-07 人工智能

869阅读

北大推出首个多轮多模态PPT任务完成基准PPTC GPT-4完成正确率仅6%

北大和微软亚洲研究院的研究人员提出了一项新的评估基准PPTC，旨在评估大型语言模型在复杂多轮多模态PPT任务中的表现。他们通过创建包含数百个多模态指令的数据集，挑战大模型在多轮人机对话中生成PPT文档的能力。结果显示，GPT-4在创建新PPT文档任务中表...

人工智能 2023-11-07 人工智能

849阅读

百度网盘首页全新改版：个人文档feed流推荐、大模型加持2步内完成所有操作

10月17日在2023百度世界大会上，百度创始人、董事长兼首席执行官李彦宏表示，重构后的百度网盘，不但实现了从图形界面交互到自然语言交互的转变，还增强了多模态信息理解。据了解，自2012年上线至今，百度网盘已积累8亿用户，文件量级达4万亿，每天用户会上传...

AIGC 2023-11-07 人工智能

991阅读

OpenAI推出GPT-4升级版GPT-4 Turbo：功能更强大且更便宜

11月7日消息，据外媒报道，当地时间周一，美国人工智能研究公司OpenAI推出了GPT-4 Turbo，这是其大语言模型GPT-4的升级版本。据悉，OpenAI在今年3月14日推出了第一个版本的GPT-4。它是一个多模态大型语言模型，支持图像和文本输入，...

AIGC 2023-11-07 人工智能

801阅读

GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型（例如ChatGPT和GPT-4）进行的评...

人工智能 2023-11-07 人工智能

910阅读

深夜炸场，ChatGPT一周年：无需编程，全民定义GPT的时代，来了！

撰稿 | 云昭深夜又是一场王炸！在ChatGPT发布一周年之际，OpenAI 创始人Altman 在首届开发者大会上全场放大招，台下掌声不断。无需编程，甚至无需敲键盘，单纯通过语音聊天就能构建一个专属自定义的GPT！这个消息实在太燃了！以至于推特...

人工智能 2023-11-07 人工智能

799阅读

科普神文，GPT背后的Transformer模型

上次《解读AI大模型，从了解token开始》一文中，我从最基础的概念“token”着手，跳过了复杂的算法逻辑，相信已经让大家建立起对AI大模型工作原理的清晰认知。但如果仅仅只是依靠对文本的编码与数据分析，那人工智能时代应该早就到来了，为什么唯独是GPT...

AIGC 2023-11-07 人工智能

1003阅读

AI视野：OpenAI发布GPT-4Turbo；xAI推出PromptIDE工具；美团首个AI产品“Wow”亮相；百家号AI笔记功能将下线

???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务在OpenAI首届开发者大会DevDay活动上，OpenAI发布了GPT-4Turbo模型和自定义GPTs服务，以及其他新功能和API，如Assistants API和新的模态AP...

AIGC 2023-11-07 人工智能

877阅读

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

IT之家 11 月 7 日消息，微软亚洲研究院联合北京大学、西安交通大学等高校，提出了一项名为“从错误中学习（Learning from Mistake，LeMA）”的 AI 训练方法，号称可以通过模仿人类学习知识的过程，来改进 AI 推理能力。当下...

人工智能 2023-11-07 人工智能

824阅读

OpenAI CEO：GPT-4周活用户数达1亿，仍是世界上能力最强AI大模型

11月7日消息，美国当地时间周一，在OpenAI首届开发者大会上，该公司首席执行官萨姆·奥特曼（Sam Altman）宣布，ChatGPT的周活用户数达到1亿。奥特曼还特别提到“公司在今年3月发布的GPT-4，至今仍是世界上能力最强的AI大模型”。自...

人工智能 2023-11-07 人工智能

777阅读

百度百家号：度加创作工具平台“AI笔记”功能将下线

百度百家号发布《关于度加创作工具平台【AI笔记】下线通知》称，由于业务升级调整，将于2023年11月30日起对度加创作工具平台-【AI笔记】功能进行下线，其他功能不受影响，仍可正常使用。创作者在下线前，需要及时备份未发布的笔记草稿，下线后未发布的笔记草稿...

人工智能 2023-11-07 人工智能

1228阅读

让大模型自主探索开放世界，北大&智源提出训练框架LLaMA-Rider

大语言模型因其强大而通用的语言生成、理解能力，展现出了成为通用智能体的潜力。与此同时，在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此，大语言模型如何适配开放世界是一个重要的研究问题。北京大学和北京智源人工智能研究院的团队针对这个问题提出了...

人工智能 2023-11-07 人工智能

1246阅读

联发科发布天玑9300生成式AI移动芯片支持运行330亿参数大模型

昨日晚间，联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片，采用台积电第三代4nm 制程。该芯片预计于2023年底上市。这款芯片采用全大核架构设计，提供高智能、高性能、高能效、低功耗的特性，为用户带来卓越的生成式 AI 体验。天玑9300采...

AIGC 2023-11-07 人工智能

839阅读

独家｜美团首个AI产品“Wow”亮相，押注交互伴聊

美团AI产品首发，切入交互聊天赛道 Tech星球体验发现，Wow是一款AI伴聊产品，这是AI的一个主流应用场景。目前已经有腾讯音乐的“未伴”、百度的“小侃星球”等类似产品相继面世。 Wow的产品设计较为简洁，整个产品由聊天、发现和个人中心三个Tab标签。...

AIGC 2023-11-07 人工智能

909阅读

ChatGPT王炸升级！更强版GPT-4上线，API定价打骨折，发布现场掌声没停过

ChatGPT，今天裂变成无数个GPT。 OpenAI在首届开发者日上，正式公布自定义GPT。还将上线“GPT商店”，与创作者分享收入。 CEO山姆·奥特曼现场登台演示，3分钟不到，只凭几步操作做好一个“创业导师GPT”。接下来，“创业导师GPT...

AIGC 2023-11-07 人工智能

954阅读

天玑9300 AI能力飙升：最高支持330亿参数的AI大语言模型

快科技11月6日消息，联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片，支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。据介绍，天玑9300集成MediaTek第七代AI处理器APU 790，为生成式AI而设计，其性能和能效得到显著提升，整...

人工智能 2023-11-07 人工智能

801阅读

让大模型忘记哈利波特，微软新研究上演Llama 2记忆消除术，真·用魔法打败魔法（doge）

最近微软一项研究让Llama 2选择性失忆了，把哈利波特忘得一干二净。现在问模型“哈利波特是谁？”，它的回答是这样婶儿的：木有赫敏、罗恩，木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的，比如给它一个看似非常普通的提示“那年秋天，哈...

人工智能 2023-11-07 人工智能

763阅读

号称和GPT-4持平！知乎大模型“知海图AI”将正式开放

快科技11月6日消息，近日知乎宣布其知海图AI”大模型将面向公众开放，并择机上线相关产品，以提供服务给创作者、讨论场所、信息获取者以及内容运营者等各类型用户。据介绍，知海图AI”大模型的训练主要是基于CPM企业级大模型与ModelForce大模型系统，拥...

人工智能 2023-11-06 人工智能

891阅读

GPU推理提速4倍！FlashDecoding++技术加速大模型推理

推理大模型（LLM）是AI服务提供商面临的巨大经济挑战之一，因为运营这些模型的成本非常高。FlashDecoding++ 是一种新的技术，旨在解决这一问题，它通过提高LLM推理速度和降低成本，为使用大模型赚钱提供了新的可能性。论文地址:https://...

人工智能 2023-11-06 人工智能

854阅读

华为盘古铁路大模型显威：效率比人工提升2倍

快科技11月6日消息，在OpenAI发布ChatGPT后，全球已发布数百个大模型。其中华为的盘古大模型号称不作诗只做事”，聚焦价值场景，致力于深耕政务、金融、制造、煤矿、铁路、制药、气象等行业。近日，华为就介绍了华为盘古铁路大模型，相比人工作业，工作效...

人工智能 2023-11-06 人工智能

832阅读

xAI Grok内测资格在哪里申请 Grok资格申请入口介绍

马斯克近日正式宣布推出xAI Grok大模型，这是xAI团队发布的首个AI大模型产品。据xAI的声明称，该产品“有智慧，还有叛逆的性格”，并且能回答被大多数其他AI系统拒绝的辛辣问题。 xAI Grok现在已经可以进行内测资格申请（点击进入），用户可在官...

AIGC 2023-11-06 人工智能

950阅读

AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

????大模型动态李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。项目地址:htt...

AIGC 2023-11-06 人工智能

939阅读

大型语言模型（LLM）技术精要，不看亏了

哈喽，大家好。今天分享一篇知乎高赞文章，作者是张俊林老师。图片读完收获很多，能帮大家更好地理解、学习大模型。原文有2.8w字，我提炼了核心要点，阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型（LLM）...

AIGC 2023-11-06 人工智能

975阅读

李开复领队开源大模型 Yi，40万字上下文窗口破纪录

由李开复博士亲自下场创办的零一万物（01.ai），自3月底官宣成立后，于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。在线上发布环节，李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口，免费开...

AIGC 2023-11-06 人工智能

991阅读

蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存

蚂蚁集团旗下CodeFuse 代码大模型宣布开源了 ModelCache 大模型语义缓存，可以降低大型模型应用的推理成本，提升用户体验。 ModelCache 的架构包括 adapter、embedding、similarity 和 data_manage...

人工智能 2023-11-06 人工智能

918阅读

百度网盘首页改版引入青春感 UI 视觉和大模型智能助理

百度网盘宣布首页改版，新版采用了 “多巴胺” 配色和个性化字体设计，引入了左一屏汇总网盘常用功能组件，并通过 feed 流推荐个人网盘中的 “尘封的记忆”。据悉，这是百度网盘近4年以来最大的一次首页改版，旨在通过更简单的交互方式、更青春感的 UI 视觉和...

AIGC 2023-11-06 人工智能

927阅读

马斯克xAI公布大模型详细进展，Grok只训练了2个月

近几日，马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ，直接把网友的好奇心拉满。和总是一本正经回答问题的 ChatGPT 不同，Grok 自带幽默和嘲讽技能。就像下图所展示的，Grok 在被...

AIGC 2023-11-06 人工智能

908阅读

李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字

零一万物推出了「Yi」系列开源大模型，其中Yi-34B在全球开源大模型排行榜上取得了显著成就，击败了其他竞品模型，成为双料冠军，尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型，拥有强大的语言理解和处理能力，可以满足国内市场的需求。 ht...

AIGC 2023-11-06 人工智能

833阅读

李开复带队创办！零一万物发布首款大模型Yi：号称世界最强

快科技11月6日消息，近日，创新工场董事长兼CEO李开复带队创办的AI大模型创业公司零一万物宣布，正式发布首款研发的最强开源人工智能大模型系列Yi。此次发布的首个公开版本共包括两款:Yi-6B和Yi-34B，其数据参数量分别为60亿和340亿，...

人工智能 2023-11-06 人工智能

846阅读

大跌眼镜！GPT-4V错觉挑战实录：该错的没错，不该错的反而错了

GPT-4V挑战视觉错误图，结果令人“大跌眼镜”。像这种判断“哪边颜色更亮”的题，一个没做对：读图片中隐藏信息的也傻傻看不出，怎么问都说“没有啊”：但是呢，这种人类乍一看绝对会错的图，它又成功答对：以及这样的错位图，它对了又没完全对。。...

人工智能 2023-11-06 人工智能

726阅读

元象XVERSE开源650亿参数通用大模型XVERSE-65B

元象XVERSE宣布开源650亿参数高性能通用大模型XVERSE-65B，无条件免费商用。 XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构，参数规模达到了650亿。模型通过训练了2....

人工智能 2023-11-06 人工智能

849阅读

北大具身智能新成果：无需训练，听指令就能灵活走位

北京大学董豪团队具身导航最新成果来了：无需额外建图和训练，只需说出导航指令，如： Walk forward across the room and walk through the panty followed by the kitchen. Stan...

人工智能 2023-11-06 人工智能

921阅读

国内最大开源模型发布，无条件免费商用！参数650亿，基于2.6万亿token训练

国内规模最大的开源大模型来了：参数650亿、基于2.6-3.2万亿token训练。排名仅次于“猎鹰”和“羊驼”，性能媲美GPT3.5，现在就能无条件免费商用。它就是来自深圳元象公司的XVERSE。根据算力、资源限制和具体任务需求的不同，我们能对...

人工智能 2023-11-06 人工智能

857阅读