大语言模型第18页

构建企业级大语言模型应用的秘诀：GitHub Copilot 的实践之路

GitHub Copilot 的开发团队分享了他们在构建能够同时为个人和企业用户带来价值的大语言模型（LLM）应用的心得体会。本文经授权转载宝玉老师的个人博客（微博@宝玉xp），链接：https://baoyu.io/translatio...

AIGC 2023-12-20 人工智能

969阅读

ChatGPT的2023：开创人工智能的新纪元

12月16日，The Verge 根据获取的内部文件和 Lark（飞书）聊天记录报道称，字节跳动曾秘密使用 OpenAI 的模型输出文本来训练自己的大语言模型。即便中止使用 GPT 生成文本之后，代号为 Project...

人工智能 2023-12-19 人工智能

771阅读

正面刚ChatGPT，谷歌发布Bard! AI们要battle起来了？

面对ChatGPT的步步紧逼，谷歌终于做出了回应，选择了正面刚。北京时间2月7日凌晨，谷歌CEO桑达尔·皮查伊（Sundar Pichai）宣布谷歌推出了下一代对话AI系统Bard。消息一出，自然引起广泛讨论，ChatGPT的火爆程度有目共睹，...

大数据 2023-12-19 人工智能

932阅读

Mistral AI CEO宣布于2024年开源GPT-4级别模型

法国初创公司Mistral AI的首席执行官Arthur Mensch在法国国家广播电台宣布，公司计划于2024年开源GPT-4级模型，引发了业界的关注。最近，Mistral AI推出了基于MoE架构的8X7B模型，与GPT3.5和Llama270B等其...

大数据 2023-12-19 人工智能

870阅读

大语言模型之四-LlaMA-2从模型到应用

最近开源大语言模型LlaMA-2火出圈，从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力...

大数据 2023-12-19 人工智能

1606阅读

推理性能超H100十倍！21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」，2人公司估值3400万刀

像Pika一样的神级创业故事又要再次上演了？两位哈佛退学的年轻人，想要制造一款专用于大语言模型加速的AI加速器芯片，将于2024年第三季度交付，推理性能达H100的10倍。在今年6月份，两位创始人Gavin Uberti和Chris Zhu创立了E...

大数据 2023-12-19 人工智能

808阅读

AI、零信任、边缘现代化与多云，2024这些技术趋势值得关注

事实上，在这场由ChatGPT激起的新一轮AI浪潮中，全球科技巨头、AI厂商、行业翘楚等纷纷下场，唯恐错过此番科技盛宴。同时，GenAI蓬勃发展产业规模也在高速增长，麦肯锡调查数据显示，2022年GenAI市场收入为400亿美元，预计2027年及203...

生成式AI 2023-12-19 人工智能

828阅读

【大模型】LLaMA

目录 1. 模型介绍 2. 权重下载 1. 模型介绍 LLaMA 是 2023 年 Meta 发布的基础大语言模型，该模型有四个版本，分别是7B、13B、33B、65B参数的模型。相对于 GPT 类的模型，LLaMA 更加轻量一些，主要体现在...

AIGC 2023-12-18 人工智能

973阅读

将ChatGPT变成Midjourney提示生成器

已经有人总结过可以让ChatGPT作为Midjourney图像生成的模板。在本文中，我们将展示如何根据个人用例创建这些提示，这可以让ChatGPT生成的提示可控性更高。选择提示模板 Midjourney的模板结构性很强，所以我们这里使用一下的结...

人工智能 2023-12-18 人工智能

857阅读

OpenAI「登月计划」剑指超级AI！LeCun提出AGI之路七阶段，打造世界模型是首位

通用AGI，或许近在咫尺。 OpenAI下一步「登月计划」，就是实现人类期待已久的超级人工智能，而到达这一步的前提是——解决超级AI对齐问题。就在前几天，首席科学家Ilya带头OpenAI超级对齐团队取了的实质性成果。他们发表的最新论文，首次确定了超...

生成式AI 2023-12-18 人工智能

954阅读

中国科大等发布SciGuard大模型建立首个科学风险基准

在中国科大等机构的最新研究中，科学家们发布了一项重要的成果，即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型，以防止其在生物、化学、药物等领域被不当使用。为此，研究团队还建立了首个专注于化学科学领域安...

大数据 2023-12-18 人工智能

812阅读

大语言模型微调数据竞赛，天翼云斩获冠军！

近日，天池FT-Data Ranker竞赛落下帷幕，天翼云智能边缘事业部AI团队（后称天翼云AI团队）凭借在大语言模型（LLM）训练数据增强方面的卓越研究，荣获大语言模型微调数据竞赛——7B模型赛道冠军。 FT-Data Ranker竞赛是一场面向大语...

大数据 2023-12-18 人工智能

811阅读

字节自研大模型，却因用ChatGPT被封号惹争议？官方回应了

上周末，有外媒报道称，字节跳动在使用 OpenAI 技术开发自有大语言模型时，因违反 OpenAI 服务条款从而遭账号禁用。据 The Verge 报道，字节跳动内部正在研发的大语言模型项目名为「种子计划」（Project Seed）。由于训练大模型...

AIGC 2023-12-18 人工智能

883阅读

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调（SFT）人...

大数据 2023-12-18 人工智能

1000阅读

GPT-4V都搞不明白的未来推理有解法了！来自华科大&上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的GPT-4V（如下图所示），也无法很好地解决这一问题。 △ GPT-4V的错误案例现在，华科大和上科大团队提出了一个赋予...

生成式AI 2023-12-18 人工智能

868阅读

字节跳动澄清“OpenAI服务被禁”: 未来几天将再次全面排查

近日，有外媒报道称，字节跳动在使用OpenAI技术开发自己的大语言模型，违反了OpenAI服务条款，导致被OpenAI封禁账户。对此，字节跳动相关负责人对外界回应表示，公司在使用OpenAI相关服务时，强调要遵守其使用条款。负责人介绍，今年年初，当技...

生成式AI 2023-12-18 人工智能

807阅读

大模型公司「卷」芯片英伟达危？

人工智能的行业竞争，不仅是OpenAI与谷歌等各大互联网巨头的大模型之争，支撑运算的芯片赛道也暗流涌动，大模型“制造机”们也加入了赛道。 OpenAI计划从CEO Sam Altman投资的一家初创公司Rain AI订购更高效的NPU芯片;微软也推出两款自...

大数据 2023-12-18 人工智能

984阅读

我们聊聊如何增强ChatGPT处理模糊问题能力

提示工程技术可帮助大语言模型在检索增强生成系统中处理代词等复杂核心参照物。译自Improving ChatGPT’s Ability to Understand Ambiguous Prompts，作者 Cheney Zhang 是 Zilliz 的一...

人工智能 2023-12-18 人工智能

937阅读

尊嘟假嘟？2023年人工智能行业新诞生10家独角兽，AIGC竟占近一半

今年的 AIGC 持续热了一年，从王慧文等大佬的入局，到百度发布「文心一言」，各大巨头纷纷发布大模型产品，切实地给中国人工智能赛道的融资添了一把浓烈的火。回顾这即将过去的一整年，虽然 2023 年投融资整体行业遇冷，各种坏消息不断，但总体而言，AI 行...

生成式AI 2023-12-17 人工智能

932阅读

字节GPT账户突遭冻结，OpenAI：正在调查不当行为

字节跳动，陷入大模型舆论风波。据The Verge报道：字节跳动一直在秘密使用OpenAI的技术，来开发自家大语言模型（LLM）。而在此消息被披露不久，The Verge进一步称OpenAI已经暂停了字节跳动的账户。具体而言，OpenAI发言人...

大数据 2023-12-17 人工智能

845阅读

3个问题！验明GPT-4真身；基于GPT科研加速技巧汇总；Midjourney神仙教程；印象笔记有AI功能啦 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 『GPT-4 验明真身的三个经典问题』快速区分 GPT-3.5 与 GPT-4，快来对答案这里收集了几个免费使用 GPT-4 的工具，社区小伙...

AIGC 2023-12-17 人工智能

965阅读

最强文生图跨模态大模型：Stable Diffusion

文章目录一、概述二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练三、Stable Diffusion 发展 3.1 图形界面...

大数据 2023-12-17 人工智能

1804阅读

AIGC｜AGI究竟是什么？为什么大家都在争先入场？

一、AI大语言模型进入爆发阶段 2022年12月ChatGPT突然爆火，原因是其表现出来的智能化已经远远突破了我们的常规认知。虽然其呈现在使用者面前仅仅只是一个简单的对话问答形式，但是它的内容化水平非常强大，甚至在某些方面已经超过人类了，这是人工智能...

AIGC 2023-12-16 人工智能

955阅读

下一代自动驾驶系统，少不了大模型，系统调研来了

随着大语言模型 (LLM 和视觉基础模型 (VFM 的出现，受益于大模型的多模态人工智能系统有潜力像人类一样全面感知现实世界、做出决策。在最近几个月里，LLM 已经在自动驾驶研究中引起了广泛关注。尽管 LLM 具有巨大潜力，但其在驾驶系统中的关键挑战...

生成式AI 2023-12-16 人工智能

897阅读

本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

OpenAI公司基于GPT模型的ChatGPT风光无两，眼看它起朱楼，眼看它宴宾客，FaceBook终于坐不住了，发布了同样基于LLM的人工智能大语言模型LLaMA，号称包含70亿、130亿、330亿和650亿这4种参数规模的模型，参数是指神经网络中的权重...

大数据 2023-12-16 人工智能

776阅读

AI首次攻克难倒陶哲轩数学难题，DeepMind里程碑算法登Nature！LLM搜代码自我进化

上限集问题，是困扰数学家们多年的开放性问题。著名数学家陶哲轩，就曾将上限集问题描述为自己最喜欢的开放性问题。陶哲轩博客而大语言模型，竟然在这个问题上做出了新发现。今天，Google DeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联...

人工智能 2023-12-16 人工智能

835阅读

ChatGPT引爆AIGC，垂类龙头迎来“创新春天”

文|智能相对论作者|陈壹一款AI产品，到底有多神？ ChatGPT刷新了我们的认知。它用2个月时间，完成TikTok花9个月，Instagram花2年半才做到的事，成为史上用户增速最快破亿的...

AIGC 2023-12-16 人工智能

908阅读

中国版的chatGPT“文心一言“到底怎样？

GPT4的提前发布，把压力着实给到百度了！在ChatGPT引爆聊天机器人领域后的数月，我们终于迎来了国内的第一款生成式对话产品。 3月16日14:00，百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言，...

大数据 2023-12-16 人工智能

994阅读

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

本文来自DataLearnerAI官方网站：重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了 | 数据学习者官方网站(Datalearner https://www.datalea...

大数据 2023-12-15 人工智能

1272阅读

OpenAI首席科学家有个计划，寻找方法控制超级人工智能

12月15日消息，早在OpenAI成立之初，便承诺构建有益于全人类的人工智能，即使这些人工智能有可能比其创造者更聪明。自ChatGPT首次亮相以来，OpenAI的商业野心逐渐凸显。最近，该公司宣布成立了一个致力于研究未来超级人工智能的新研究团队，并已经...

大数据 2023-12-15 人工智能

833阅读

GPT-2能监督GPT-4，Ilya带头OpenAI超级对齐首篇论文来了：AI对齐AI取得实证结果

人类无法监督超级人工智能，但人工智能可以。过去一年，以「预测下一个 Token」为本质的大模型已经横扫人类世界的多项任务，展现了人工智能的巨大潜力。在近日的一次访谈中，OpenAI 首席科学家 Ilya Sutskever 大胆预言，如果模型能够很好地...

大数据 2023-12-15 人工智能

859阅读

OpenAI即将发布GPT-4.5？Sam Altman辟谣：假的

据 Reddit 和 X 上流传的一张截图显示，OpenAI 可能很快就会发布其最新的大语言模型 GPT4.5。然而，OpenAI CEO Sam Altman 后来证实这个 “泄露” 是假的。这张据称 “泄露” 的截图在社交媒体上广为传播，包括 X 在...

生成式AI 2023-12-15 人工智能

794阅读

【Stable Diffusion】基本概念之lora

1.基本概念 Lora，英文全称“Low-Rank Adaptation of Large Langurage Models”，直译为大语言模型的低阶适应，这是微软的研究人员为了解决大语言模型微调而开发的一项技术2.作用只要是图片上的特征都可以提取并训练...

AIGC 2023-12-15 人工智能

1450阅读

【AI绘画】用魔法打败魔法,用ChatGPT生成绘画

随着人工智能技术的不断发展，我们可以利用ChatAI这款大语言模型来辅助我们在绘画过程中获得更多创意和灵感。一、了解AI绘画功能它可以快速、自动、准确地从大量原始数据中生成新内容，大大提高了内容创作效率，AI绘画使用机器学习算法，自动识别文...

AIGC 2023-12-15 人工智能

1020阅读

效率拉满，3款国内免费不限次数的AI写作神器

HI，同学们，我是赤辰，本期是第19篇AI工具类教程，文章底部准备了粉丝福利，看完后可领取！本期给大家分享三款国内免费不限次数的AI写作工具，让你拥有AI智能创作助手，远离写文案没灵感的烦恼。 1. Effidit文涌编辑器Effidit文涌编辑器是腾讯...

大数据 2023-12-14 人工智能

3395阅读

北京大学发布EAGLE 大模型推理效率无损提升3倍

近年来，大语言模型在各领域应用广泛，但其文本生成过程昂贵且缓慢。为解决这一问题，滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布了EAGLE。EAGLE的目标是提升大语言模型的推理速度，同时确保输出文本的分布一致性。通过外推大语言模型的第二顶层特征向量...

人工智能 2023-12-14 人工智能

928阅读

24 LLM错误代码补全：机器学习顶会NeurIPS‘23 智能体评估：自行构建数据集Buggy-HumanEval、Buggy-FixEval+错误代码补全+修复模型【网安AIGC专题11.22】

Large Language Models of Code Fail at Completing Code with Potential Bugs 写在最前面论文名片对于命名实体识别、关系抽取任务的启发课堂讨论实验自己构建的数据集...

人工智能 2023-12-14 人工智能

1007阅读

首个「创造式任务」基准来了！北大清华联手发布Creative Agents：专为想象力而生！

近年来，许多研究通过训练服从自然语言指令的智能体，让智能体具有了解决各种开放式任务的能力。例如，SayCan[1]利用语言模型实现了根据语言描述解决各种室内机器人任务的智能体，Steve-1[2]训练端到端的策略实现了能够在《我的世界》（Minecra...

AIGC 2023-12-14 人工智能

873阅读

大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

大语言模型（LLM）被越来越多应用于各种领域。然而，它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则：每个词（token）的生成都需要进行一次前向传播，需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。近日，滑铁...

AIGC 2023-12-14 人工智能

808阅读

一张图or文字生成无限3D世界！斯坦福吴佳俊团队新作，让网友直呼“难以置信”

斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作！仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景：只需输入一段古诗词，诗中场景立刻映入眼帘：而且还是来回式的，可以再倒回去的那种：同一起点可以进入不同场景：真实场景也可以，其中的...

大数据 2023-12-14 人工智能

847阅读

OpenAI首席科学家入选《自然》年度十大人物 ChatGPT也有上榜

12月14日消息，据外媒报道，在近一年大热的人工智能领域，OpenAI无疑是最受关注的企业，他们训练的人工智能聊天机器人ChatGPT及开发的大语言模型，是业界重点关注的，OpenAI的高管也是这一领域备受关注的。从外媒最新的报道来看，在人工智能领域取得...

AIGC 2023-12-14 人工智能

830阅读

使用LLama和ChatGPT为多聊天后端构建微服务

微服务架构便于创建边界明确定义的灵活独立服务。这种可扩展的方法使开发人员能够在不影响整个应用程序的情况下单独维护和完善服务。然而，若要充分发挥微服务架构的潜力、特别是针对基于人工智能的聊天应用程序，需要与最新的大语言模型（LLM，比如Meta LLama ...

人工智能 2023-12-14 人工智能

953阅读

AI创新之美：AIGC探讨2024年春晚吉祥物龙辰辰的AI绘画之独特观点

? 鸽芷咕：个人主页 ? 个人专栏:《粉丝福利》《linux深造日志》 ⛺️生活的理想，就是为了理想的生活! 文章目录引言一、龙辰辰事件概述二、为什么龙辰辰会被质疑AI创作？ 1....

大数据 2023-12-14 人工智能

1077阅读

解锁编程潜能：探索亚马逊CodeWhisperer，打造编程世界的声音引导者

文章目录前言一、什么是 Amazon CodeWhisperer？二、如何使用CodeWhisperer？安装CodeWhisperer插件配置CodeWhisperer 生成注释和文档总结前言随着CHATG...

大数据 2023-12-14 人工智能

811阅读

聊聊最近chatGPT对程序员的焦虑攻击

最近各种自媒体都在叛卖gpt职业焦虑，连程序圈子也不能幸免。甚至有正准备入行的同学私信我到底计算机还能不能学，研究生还能不能读。我985硕毕业，呆过大厂和小厂，现工作5年的程序员，抛开那些胡吹海谈的软文，想和大家深入聊聊chatgpt和...

AIGC 2023-12-13 人工智能

852阅读

随意指定CLIP关注区域！上交复旦等发布Alpha-CLIP：同时保持全图+局部检测能力

CLIP是目前最流行的视觉基座模型，其应用场景包括但不限于：与LLM大语言模型结合成为视觉多模态大模型；作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model，实现image-to-3D；用于...

生成式AI 2023-12-13 人工智能

1068阅读

面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt

近日，阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型，可以从简单的图片描述中生成高质量的提示词，从而使文生图模型能够生成更美观的图像。BeautifulP...

AIGC 2023-12-13 人工智能

864阅读

首个GPT-4驱动的人形机器人！无需编程+零样本学习，还可根据口头反馈调整行为

让GPT-4操纵人形机器人，事先不做任何编程or训练，能搞成啥样儿？答案是：太猎奇了！这不，要求机器人表演“在昏暗电影院里狂炫爆米花，却突然发现吃的是隔壁陌生人的?”。在GPT-4的操纵下，机器人笑容凝固，“尴尬”得摇头扶额后仰：但在尴尬...

AIGC 2023-12-13 人工智能

865阅读

LLaMA及其子孙模型概述

文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性，对...

大数据 2023-12-13 人工智能

1031阅读