大语言模型第8页

纯C语言手搓GPT-2，前OpenAI、特斯拉高管新项目火了

众所周知，大语言模型还在快速发展，应该有很多可以优化的地方。我用纯 C 语言来写，是不是能优化一大截？也许很多人开过这样的脑洞，现在有大佬实现了。今天凌晨，前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy...

生成式AI 2024-04-09 人工智能

876阅读

金山办公WPS 365升级推出 WPS AI 企业版和 WPS 协作

今日，金山办公在北京举行生产力大会，发布了面向组织和企业的办公新质生产力平台 WPS365。WPS365包含升级的 WPS Office、最新发布的 WPS AI 企业版和 WPS 协作，整合文档、AI 和协作能力，实现一站式 AI 办公。 WPS365覆...

人工智能 2024-04-09 人工智能

1062阅读

融汇生成式人工智能，全面提升HPE Aruba Networking Central平台AIOps能力

美国德克萨斯州休斯顿-2024年4月8日-Hewlett Packard Enterprise（NYSE：HPE）日前宣布将在HPE Aruba Networking Central上集成多个生成式AI大语言模型，以拓展其AIOps网络管理能力。HPE...

AIGC 2024-04-09 人工智能

895阅读

AI颠覆数学研究！菲尔兹奖得主、华裔数学家领衔11篇顶刊论文｜陶哲轩转赞

AI，的确正在改变数学。最近，一直十分关注这个议题的陶哲轩，转发了最近一期的《美国数学学会通报》（Bulletin of the American Mathematical Society）。围绕「机器会改变数学吗？」这个话题，众多数学家发表了自己的...

大数据 2024-04-09 人工智能

875阅读

近屿智能独家发布：AIGC大模型工程师和产品经理学习路径图，AI技术不再难懂！

随着人工智能技术的飞速发展，AI取代人工的现象在各个行业和领域变得日益普遍，不少人因此忧心忡忡，担心自己的前途受到AI的冲击。实际上，AI不会取代你的工作，会取代你的是懂AI的人，如何提升自己与他人的知识壁垒，如何学习AIGC？相信在刚刚过去2023这个A...

人工智能 2024-04-08 人工智能

1311阅读

Spotify 推出个性化AI播放列表，用户可以使用提示构建

Spotify 推出了 AI 播放列表功能，让用户能够通过书面提示来生成个性化的音乐列表。这项新功能最初将在英国和澳大利亚的 Android 和 iOS 设备上推出，并将在未来几个月内不断改进。除了基于流派或时间范围等传统播放列表创建请求之外，Spot...

AIGC 2024-04-08 人工智能

935阅读

为什么大型语言模型都在使用 SwiGLU 作为激活函数？

如果你一直在关注大型语言模型的架构，你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的激活函数，我们本篇文章就来对他进行详细的介绍。SwiGLU其实是2020年谷歌提出的激活函数，它结合了SWISH和...

大数据 2024-04-08 人工智能

1207阅读

文心一言赋能问卷生成，打造高效问卷调研工具

当前，各种大语言模型（LLM，Large Language Model）井喷式发展，基于LLM的应用也不断涌现。但是，当开发者基于LLM开发下游应用时，LLM直接生成的结果在格式、内容等方面都存在许多不确定因素，难以与其他业务逻辑代码做数据交互，导致开发者...

大数据 2024-04-08 人工智能

904阅读

大模型融合！最新「进化算法」全自动组合开源模型，刷榜多项基准测试

人类智慧的基础并不在于单个聪明的个体，而在于集体智慧。比如说，我们的社会和经济体系就是建立在由具有不同专业和专长的不同个人组成的许多机构的基础上的。 Sakana AI团队相信，人工智能的发展也将遵循类似的集体道路。人工智能的未来不会是一个单一的、巨...

人工智能 2024-04-08 人工智能

850阅读

攻陷短视频后，Sora将需要72万块H100 GPU

OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频，吸引了全世界的目光。近日，投资机构 factorial funds 发表了一篇博文，深入探讨了 Sora 背后的一些技术细节，并对这些视频模型可能产生影响进行了探讨。最后，文中还...

人工智能 2024-04-08 人工智能

864阅读

拒绝白人与亚洲人同框，Meta图像生成器的「歧视」，被人挖出来了

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 在人工智能构筑的世界中，AI 有时会像人一样存在着某种偏见或倾向性。比如对于大语言模型而言，由于训练数据的影响会不可避免地存在性别偏见...

生成式AI 2024-04-07 人工智能

777阅读

马斯克造大模型，从特斯拉连挖高管

当全球首富埃隆・马斯克（Elon Musk）建立 xAI，准备与 OpenAI、谷歌竞争大模型时，他必须与众多科技巨头、初创公司争夺人才。不过，他使用了一些取巧的办法：从自家的特斯拉挖来了几名优秀工程师。该初创公司的网站显示，上个月，机器学习...

生成式AI 2024-04-07 人工智能

893阅读

中科大等意外发现：大模型不看图也能正确回答视觉问题！

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图，竟也能正确回答视觉问题？！中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像...

人工智能 2024-04-07 人工智能

796阅读

ChatGPT现在能帮你P图了，只需简单说几个字

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在，不论是网页、iOS 还是安卓版的 ChatGPT，都可以用上 DALL-E 3 强大的编辑图像功能了。 OpenAI 的 DA...

大数据 2024-04-07 人工智能

892阅读

AIGC知识库一周精华

元宇宙、大语言模型和智能设计是当前人工智能领域的重要发展趋势。元宇宙将虚拟和现实世界融合，开启了新的数字化交互时代。大语言模型的应用和研究不断推进，提示工程和函数调用等工具不断涌现，为人们提供更高效的文本生成和处理能力。智能设计领域...

AIGC 2024-04-07 人工智能

947阅读

龙盈智达&Fabarta：基于图智能和 AIGC 技术的金融营销解决方案

导读在金融行业的营销活动中，如何获取潜在客户以及判定企业风险是银行重点关注的方向。本方案基于 ArcGraph 图数据库和图智能分析技术，帮助企业筛选潜在客户，通过股权穿透、实控人分析自动识别风险。通过大模型企业知识中台，用户可以利用自然语言对话的方式查...

AIGC 2024-04-05 人工智能

956阅读

群晖NAS使用Docker部署大语言模型Llama 2结合内网穿透实现公网访问本地GPT聊天服务

文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址随着ChatGPT...

大数据 2024-04-04 人工智能

985阅读

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果，然而，Transformer 中自注意力带来的二次复...

AIGC 2024-04-03 人工智能

869阅读

Perplexity要搞竞价排名了，大模型的尽头……就还是广告？

还记得曾经从英伟达和贝索斯们手里融了 7360 万美元，誓要以AI驱动的透明搜索体验挑战谷歌，俘获大批社区支持者的Perplexity吗？如今，这家一直鄙视广告业务的硅谷明星AI公司，也准备开始卖广告了。作为一款会话式答案引擎，Perplexity将聊...

生成式AI 2024-04-03 人工智能

810阅读

苹果开发出新款AI：可“看懂”屏幕内容并语音回复

快科技4月2日消息，据媒体报道，苹果公司近日宣布，成功研发出一款前沿的人工智能系统ReALM（Reference Resolution As Language Modeling，即基于语言建模的参考解析）。据悉，该系统具备卓越能力，能够精准解析屏幕上模糊...

AIGC 2024-04-02 人工智能

858阅读

伊克罗德信息与墨奇科技战略合作，共塑生成式AI未来

在数字化浪潮席卷全球的今天，人工智能技术以其强大的潜力和广泛的应用前景，正引领着新一轮的科技革命。近日，伊克罗德信息与墨奇科技正式宣布双方达成战略合作，双方将围绕生成式AI技术展开，发挥各自的技术优势和资源优势，利用大语言模型LLM、向量数据库构建生成...

生成式AI 2024-04-02 人工智能

997阅读

Paper Digest | GPT-RE：基于大语言模型针对关系抽取的上下文学习

笔记整理：张廉臣，东南大学硕士，研究方向为自然语言处理、信息抽取链接：https://arxiv.org/pdf/2305.02105.pdf 持...

大数据 2024-04-02 人工智能

1021阅读

快速理解AIGC图像控制利器ControlNet和Lora的架构原理

作者公众号大数据与AI杂谈（TalkCheap），转载请标明出处 ControlNet以及Lora是什么，玩过stable diffusion AI图像生成的同学应该都不陌生。一般来说，如果你用以SD 或 SDXL为基础的模型来生成图像，产出的图...

人工智能 2024-04-02 人工智能

1589阅读

教育领域大模型技术与应用

苏喻博士，高级工程师，合肥人工智能研究院副研究员，原科大讯飞AI 教育研究院副院长，中国科学技术大学博士后，安徽省青少年信息学教育专委会秘书长，CCF 大专委-通讯委员，合肥市 D 类人才。苏喻博士一直在智慧教育方向深耕，聚焦于青少年编程。面对数据稀疏...

大数据 2024-04-02 人工智能

1358阅读

GPT-4单项仅得7.1分，揭露大模型代码能力三大短板，最新基准测试来了

首个AI软件工程师Devin正式亮相，立即引爆了整个技术界。 Devin不仅能够轻松解决编码任务，更可以自主完成软件开发的整个周期——从项目规划到部署，涵盖但不限于构建网站、自主寻找并修复 BUG、训练以及微调AI模型等。这种 “强到逆天” 的软件开发...

大数据 2024-04-01 人工智能

953阅读

我的领导马斯克：痛恨开会，不要非技术中层，推崇裁员

马斯克称得上是个“魔鬼老板”这事儿，已经出了名了。现在，他的老部下卡帕西（Andrej Karpathy）又在最新访谈中“锤”了他一把（doge）：我不得不恳求他允许我招人。他（马斯克）总是默认要裁掉员工。喜欢裁人之外，在这场红杉组织的AI A...

生成式AI 2024-04-01 人工智能

772阅读

微软、OpenAI又搞大动作：斥资1000亿美元开发AI超算「星际之门」

根据 Information 消息，微软和 OpenAI 正在计划一个数据中心项目，该项目将包含一个拥有数百万专用服务器芯片的超级计算机，以支持 OpenAI 的人工智能技术。另外，项目成本可能高达 1000 亿美元，包括一个名为 Stargate （「...

大数据 2024-04-01 人工智能

777阅读

3分钟学会写文心一言指令

码到三十五：个人主页心中有诗画，指尖舞代码，目光览世界，步履越千山，人间尽值得 ! 文心一言是百度研发的人工智能大语言模型产品，能够通过上一句话，预测生成下一段话。任何人都可以通过输入【指令】和文心一言进行对...

AIGC 2024-03-31 人工智能

1156阅读

AIGC｜Agentbot的构建实践

最近这几个月，智能体这一概念逐渐进入人们的视野并受到广泛讨论，各智能体和类智能体项目层出不穷。智能体不断被冠以“大模型下半场”，“软件2.0”等等称号，被认为是迈向通用人工智能的一大步，BabyGPT, AutoGPT等实验性产品相继出新。不满足于现在的聊...

人工智能 2024-03-30 人工智能

932阅读

Hume AI EVI对话人工智能体验入口情感大语言模型eLLM使用地址

Hume.AI专注于开发能够理解人类情感和表情的技术，提供表情测量API和自定义模型API，以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI，采用了情感大语言模型（eLLM）技术。点击前往Hume.AI EVI体验入口谁可以从H...

人工智能 2024-03-29 人工智能

1028阅读

DeepMind终结大模型幻觉？标注事实比人类靠谱、还便宜20倍，全开源

DeepMind 这篇论文一出，人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日，社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...

AIGC 2024-03-29 人工智能

771阅读

伊克罗德信息与墨奇科技战略合作，共创生成式AI新未来

3月28日伊克罗德信息在北京举办“AI引领未来探索大模型世界”活动，与墨奇科技、亚马逊云科技共同探讨生成式AI与向量数据库大力量，并与大家共同探讨人工智能大模型在各个行业的创新应用，为企业实现更高效、创新的数智化转型！活动现场，伊克罗德信息与墨奇科技...

AIGC 2024-03-29 人工智能

927阅读

知乎AI革命：智能搜索与实时问答的融合

在生成式人工智能（Generative AI）的信息技术跃迁背景下，如何看待知乎当下和未来，有三个基本的视角: 它是大语言模型预训练中文语料最重要来源之一，例如最近现象级的大模型聊天应用Kimi Chat，就以知乎为重要的训练资料来源（甚至是80%以上的...

AIGC 2024-03-29 人工智能

904阅读

首个基于SSM-Transformer混合架构，开源商业大模型Jamba

3月29日，知名AI研究实验室AI21在官网开源了，首个基于SSM-Transformer混合架构的商业大模型——Jamba。目前，ChatGPT、Stable Difusion 、Lyria等产品使用的皆是Transformer架构，虽然在捕捉序列内长...

AIGC 2024-03-29 人工智能

929阅读

深度解析韩国AI产业：猛攻AI存储芯片，傍上大款英伟达

当美国兴致勃勃向AI发起全面总攻时，“小跟班”韩国的步伐值得留意。 2023年，韩国政府对AI研发的资助约为952亿韩元（约52亿人民币）。今年预算削减28.4%，降至684亿韩元（约37亿人民币）。有人担心预算削减会导致韩国与美国差距进一步拉大，但韩...

生成式AI 2024-03-28 人工智能

1151阅读

【AIGC调研系列】AIGC企业级模型Command-R介绍

Command-R与其他大语言模型的主要区别在于其专为企业级应用设计，特别是在检索增强生成（RAG）和工具使用方面。Command-R是一个350亿参数的高性能生成模型，具有开放式权重，能够支持多种用例，包括推理、摘要和问答[2]。它特别针对大规模生产工作...

大数据 2024-03-28 人工智能

1301阅读

今日Arxiv最热NLP大模型论文：Llama-2上下文扩大48倍的方法来了，港大发布，无需训练

引言：大语言模型的长上下文理解能力在当今的人工智能领域，大语言模型（Large Language Models，简称LLMs）的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要，因为它使得LLMs能够有效地应对各种应用场景，例如在...

大数据 2024-03-28 人工智能

965阅读

和 GPT-4 并列第一，LMSYS 基准测试显示 Claude-3 模型表现优异

3 月 28 日消息，根据 LMSYS Org 公布的最新基准测试报告，Claude-3 得分以微弱优势超越 GPT-4，成为该平台“最佳”大语言模型。 IT之家首先介绍下 LMSYS Org，该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内...

人工智能 2024-03-28 人工智能

868阅读

DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5

最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型，还在效率上有所突破。DBRX的基础和微调版本均已发布，为研究和商业应用提供了丰富的资源。 GitHub 链接：https:/...

生成式AI 2024-03-28 人工智能

907阅读

Hume AI发布对话AI——EVI：具备情感感知能力

Hume AI近日发布了一款具有情感感知能力的对话AI:EVI，这款产品采用了一种被称为情感大语言模型（eLLM）的多模态生成AI技术。情感大语言模型（eLLM）是一种结合了大型语言模型(LLMs 的语言理解能力和表情测量技术的情感感知能力的新技术。这种...

AIGC 2024-03-28 人工智能

874阅读

深夜里，女朋友给我讲解AI大语言模型的技术原理，搞得我又失眠了

随着ChatGPT的横空出世，各种大模型如雨后春笋一般涌现。女朋友最近研究了大模型，准备深夜给我讲解技术原理。可是我真的好困啊，但她说，AI最近那么火，你确定不想学习下吗？她说，大语言模型是一种人工智能技术，它可以理解和生成人类语言。这种模型的技术原...

生成式AI 2024-03-28 人工智能

868阅读

谷歌推出”自我发现“框架，极大增强GPT-4等大模型推理能力

随着ChatGPT的出现，大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面，面临内容不准确、安全等难题。谷歌Deepmind和南加州大学的研究人员提出了“SELF-DISCOVER”。这是一种用于大语言模型的通用框架...

生成式AI 2024-03-28 人工智能

820阅读

前谷歌工程师创业造AI芯片，要比英伟达好十倍！已融资2500万美元

3月28日消息，英伟达在AI芯片市场的主导地位激发了其他公司自主设计芯片的决心。尽管从头开始设计芯片充满挑战，耗时多年且成本高昂，通常以失败告终，但人工智能的巨大潜力驱使业界人士勇敢尝试。在这一背景下，两位前谷歌工程师共同创立了MatX。他们利用在谷...

大数据 2024-03-28 人工智能

817阅读

近屿智能成功完成A轮融资，打造独家AIGC工程师与产品经理学习路径图引发热议

近屿智能OJAC的发展历程与行业实力在2024年1月，上海近屿智能科技有限公司（简称近屿智能）宣布成功完成A轮融资。智望资本作为领头投资者，金沙江创投也参与了增资。这一里程碑事件不仅突显了近屿智能在人力资源技术领域的领先地位，也显示了投资者对其技术实力...

AIGC 2024-03-27 人工智能

964阅读

智能体DS-Agent基于案例推理，让GPT-4数据科学任务接近100%

在大数据时代，数据科学覆盖了从数据中挖掘见解的全周期，包括数据收集、处理、建模、预测等关键环节。鉴于数据科学项目的复杂本质以及对人类专家知识的深度依赖，自动化在改变数据科学范式方面拥有极大的发展空间。随着生成式预训练语言模型的兴起，让大语言模型智能体处理...

人工智能 2024-03-27 人工智能

842阅读

新研究：大语言模型“涌现”能力不令人惊讶也不难预测

3月26日消息，一项新的研究认为，大语言模型性能的显著提升并不令人意外，也并非无法预测，实际上这是由我们衡量人工智能性能的方式所决定的。两年前，450位研究人员在一个名为超越模仿游戏基准（Beyond the Imitation Game Bench...

AIGC 2024-03-26 人工智能

881阅读

通用图大模型HiGPT：一己之力建模任何图结构关系！来自港大数据智能实验室&百度

一个模型建模所有图结构关系—— 香港大学数据智能实验室最新图结构大模型来了。它叫HiGPT，由GraphGPT原班人马打造。后者是将图数据与大模型结合的代表方法之一：通过用图指令微调将图数据与大模型对齐，在下游任务上一度彰显了惊人的泛化性（Zero...

人工智能 2024-03-26 人工智能

856阅读

利用MindsDB和Anyscale微调Mistral 7B模型

在我们为面向客户的聊天应用制作大语言模型 (LLM 时，预训练模型往往是很好的起点，但随着时间的推移，您可能希望去控制该模型聊天的整体行为和给客户带去的“感觉”，而不仅仅由基本模型所能提供。对此，我们虽然可以通过提示工程（prompt engineeri...

生成式AI 2024-03-26 人工智能

996阅读

公司即将在AI上浪费数十亿美元，如何避免成为其中之一

“这是风险投资，不是冒险资金。”这是一位亲爱的朋友曾经在提出一个想法时从一位风投那里得到的充满爱意的回应，但当我们处于一项新技术的炒作周期阶段时，这种谨慎就不复存在了。毕竟，风投公司必须动用他们筹集的所有资金，错过一家大公司的成本要高于摇摆和错失的负面...

人工智能 2024-03-25 人工智能

896阅读

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

去年 8 月，两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI，总部位于日本东京。其中，Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...

人工智能 2024-03-25 人工智能

871阅读