大型语言模型第8页

Grok-1.5官网体验入口马斯克xAI最新超长文本模型使用地址

当地时间 3 月 28 日，人工智能初创公司xAI宣布即将推出Grok-1.5模型，该模型具有长语境理解和高级推理能力。不久后，Grok-1.5将向X平台的用户和早期测试者开放。 Grok-1.5是一种先进的大型语言模型，具有出色的长文本理解和推理能力。它...

生成式AI 2024-03-29 人工智能

887阅读

X AI 发布Grok-1.5更新：性能显著提升支持128K上下文长度

昨天，X AI 发布了其最新的大型语言模型更新——Grok-1.5。该版本在编码和与数学相关的任务中表现出了显著的性能提升。据详细介绍，Grok-1.5在 MATH 基准测试中获得了50.6%的分数，在 GSM8K 基准测试中获得了90%的分数，这标志着...

AIGC 2024-03-29 人工智能

828阅读

大型语言模型如何教会自己遵循人类指令？

译者 | 李睿审校 | 重楼如今，人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ，也就是让大型语言模型教会自己遵循人类指令。指令微调(IFT ...

人工智能 2024-03-29 人工智能

944阅读

和 GPT-4 并列第一，LMSYS 基准测试显示 Claude-3 模型表现优异

3 月 28 日消息，根据 LMSYS Org 公布的最新基准测试报告，Claude-3 得分以微弱优势超越 GPT-4，成为该平台“最佳”大语言模型。 IT之家首先介绍下 LMSYS Org，该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内...

人工智能 2024-03-28 人工智能

870阅读

Hume AI发布对话AI——EVI：具备情感感知能力

Hume AI近日发布了一款具有情感感知能力的对话AI:EVI，这款产品采用了一种被称为情感大语言模型（eLLM）的多模态生成AI技术。情感大语言模型（eLLM）是一种结合了大型语言模型(LLMs 的语言理解能力和表情测量技术的情感感知能力的新技术。这种...

AIGC 2024-03-28 人工智能

875阅读

银行业中GenAI的规模化应用：选择优秀运营模式

GenAI正在给银行业带来革命性的变化，因为金融机构使用这项技术来为面向客户的聊天机器人增压，防止欺诈，并加快开发代码、准备推荐书草稿和汇总监管报告等耗时的任务。麦肯锡全球研究所估计，在整个全球银行业，GenAI每年可增加2000亿至3400亿美元的...

人工智能 2024-03-27 人工智能

1003阅读

Grammarly AI推出新AI功能，想用户提供智能建议

Grammarly近日推出了一项新的AI功能，旨在在您发送之前审查您的商业写作，并提供“战略性建议”，以使您的消息更清晰、更具影响力。无论您是在Gmail标签、文字处理器还是像Slack这样的聊天工具中撰写，这一新功能都旨在检测您何时大致完成一篇商业写作。...

生成式AI 2024-03-27 人工智能

993阅读

CIO分享：如何在企业中驾驭生成式AI

生成式AI正在大规模地为企业敞开创新的大门，但在这个新时代，高管层必须仔细监督对生成式AI的采用，以保证代码质量并减轻技术债务。生成式AI在起步阶段就已经改变组织并且给IT战略带来了深刻的影响。但是，虽然大型语言模型加速了工程敏捷性，但也打开了一道闸...

大数据 2024-03-26 人工智能

822阅读

等不及公开了！最新Sora模型细节揭秘：预计峰值需要72万块H100！每月至少4200块H100！缩放定律依旧有效！

作者 | Matthias·Plappert 翻译 | 言征出品 | 51CTO技术栈（微信号：blog51cto） OpenAI的Sora模型能够生成各种场景的极其逼真的视频，令世界惊叹不已。除了一篇公开的技术报告和TikTok上放出的酷炫视频，就...

AIGC 2024-03-26 人工智能

931阅读

苹果再发多模态论文！陪我们走过十年的“Hey Siri”会被更智能的交互方式取代吗？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）全面发力AI的苹果，再出新研究！随着人工智能技术的发展，我们熟悉的“Hey Siri”或将成为历史。苹果团队最新出炉的论文《利用大型语言模型进行设备指向性语音检测的多模...

人工智能 2024-03-26 人工智能

883阅读

Stability AI发布最新代码模型升级版本Stable Code Instruct 3B

Stability AI 在昨晚发布了其最新的代码模型升级版本——Stable Code Instruct3B。这一开源项目是继之前工作的延续，暗示着SD3模型的开源发布应该能够顺利进行，尽管后续模型的发展情况还不太明朗。这个模型以3B的规模提供了业界领...

大数据 2024-03-26 人工智能

827阅读

AIGC实战——Transformer模型

AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结系列链接 0. 前言我们在 GPT (Generative Pre-trained Transfo...

AIGC 2024-03-26 人工智能

974阅读

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

在最近的研究中，视觉-语言-动作（VLA，vision-language-action）模型的输入基本都是2D数据，没有集成更通用的3D物理世界。此外，现有的模型通过学习「感知到动作的直接映射」来进行动作预测，忽略了世界的动态性，以及动作和动态之间的关...

生成式AI 2024-03-26 人工智能

889阅读

公司即将在AI上浪费数十亿美元，如何避免成为其中之一

“这是风险投资，不是冒险资金。”这是一位亲爱的朋友曾经在提出一个想法时从一位风投那里得到的充满爱意的回应，但当我们处于一项新技术的炒作周期阶段时，这种谨慎就不复存在了。毕竟，风投公司必须动用他们筹集的所有资金，错过一家大公司的成本要高于摇摆和错失的负面...

人工智能 2024-03-25 人工智能

897阅读

预见AI的下一个十年！从Suleyman到LeCun，三位大佬坐而论道：颠覆医疗保健业、图灵测试升级、AI与物理世界交融

编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）近日，人工智能界三位大佬聚首了！一位是最近“跳槽”微软的Inflection AI 联合创始人 Mustafa Suleyman、一位是Cohere的联合创始人兼首席执行官Aida...

大数据 2024-03-25 人工智能

792阅读

能玩3D游戏的AI玩家！谷歌新智能体SIMA发布，但水平还在“新手村”

编译 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）世界上第一位AI程序员Devin诞生，让大家纷纷转发感叹“饭碗保不住”。一转眼，具有里程碑意义的AI玩家也来了！谷歌（Google）旗下DeepMind发布新智能体SIMA。 S...

人工智能 2024-03-25 人工智能

956阅读

AIGC 实战：Ollama 和 Hugging Face 是什么关系？

HuggingFace（拥抱脸）和Ollama都与**大型语言模型（LLMs）**有关，但它们的用途不同： HuggingFace： HuggingFace 是一个知名的平台，提供各种预训练的LLMs，包括流行的模型如GPT-3、BERT和...

生成式AI 2024-03-24 人工智能

2086阅读

OpenAI CEO 表示GPT-5的发布将带来令人激动的事情

一年前，OpenAI 公司发布了当时最先进的人工智能模型 GPT-4，让人们惊叹不已。自那时起，人们都在猜测下一个版本 GPT-5何时发布，期待它带来的重大飞跃。尽管 OpenAI 公司的首席执行官 Sam Altman 迄今尚未透露任何消息，但本周我们首...

AIGC 2024-03-22 人工智能

892阅读

LLM、RAG虽好，但XGBoost更香！

编译 | 言征出品 | 51CTO技术栈（微信号：blog51cto）数据&AI企业家、投资人Oliver Molander 近日在LinkedIn上的帖子中打趣道：“如果你在2022年[ChatGPT推出]之前问人工智能专家什么是LL...

人工智能 2024-03-22 人工智能

944阅读

虚拟角色平台Character AI的生成式AI聊天机器人可以说话了

Character AI 最近为其生成式 AI 聊天机器人增加了语音功能。全新的 Character Voice 功能使用户能够真正听到他们正在对话的合成人物的声音，旨在提升用户体验的参与感。 Character AI 的虚拟人格库通过大型语言模型提供对话...

AIGC 2024-03-22 人工智能

1151阅读

免费 Copilot 用户可以访问 OpenAI 的 GPT-4 Turbo；面向 3D 虚拟环境的多面手 AI 代理

? AI新闻 ? 免费 Copilot 用户可以访问 OpenAI 的 GPT-4 Turbo 摘要：微软宣布免费版Copilot已升级到GPT-4 Turbo模型，所有用户都可以免费使用。此外，Copilot Pro新增了GPT Builder工...

AIGC 2024-03-22 人工智能

974阅读

Transformer七子重聚GTC，老黄亲自赠送签名版DGX-1！7年奠基之作背后佚事揭秘

GTC大会上，老黄与Transformer八位作者一场最新访谈，简直火爆了！演讲前一个半小时，现场门外就挤满了人。许多人早早排起了长队，期待着这场别致的访谈。就连老黄也提前到场，在人群中合影。老黄主旨演讲当天，现场虚无坐席，网友戏称他为AI届的...

大数据 2024-03-21 人工智能

853阅读

端到端加速企业GenAI创新，英伟达NIM微服务成为软件企业看中的亮点！

3月20日，软件开发企业Cloudera宣布了一项重要的合作信号：要与NVIDIA一起加速生成式AI应用的部署。具体来讲，就是通过将NVIDIA的AI微服务集成到其Cloudera数据平台（CDP）中，帮助企业能够快速构建和扩展基于自身数据的定制化大型语...

大数据 2024-03-21 人工智能

940阅读

【AIGC】全球首位AI软件工程师 Devin,程序员们真的会失业吗

文章目录强烈推荐推荐一：人工智能网站推荐二：人工智能工具 Devin的诞生 Devin的特点和能力 Devin如何工作？程序员会彻底消失吗？总结强烈推荐推荐一：人工智能网站推荐二：人工智能工具专栏集锦写在最后...

大数据 2024-03-21 人工智能

884阅读

HPT官网体验入口 HyperGAI多模态语言开源模型框架免费使用地址

HPT是HyperGAI研究团队推出的新型多模态大型语言模型框架。它具有高效且可扩展地训练大型多模态基础模型的能力，能够理解包括文本、图像、视频等多种输入模态。HPT框架不仅可以从头开始训练，还可以通过现有的预训练视觉编码器和/或大型语言模型进行高效适配。...

大数据 2024-03-20 人工智能

937阅读

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

在最新的研究论文中，谷歌研究人员引入了一种名为Cappy的预训练评分器模型，旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型（LLM）所面临的挑战，其中包括高昂的计算资源成本和效率低下的训练和推理过程。目前，多任务法学硕士如T0、F...

大数据 2024-03-19 人工智能

806阅读

NVIDIA大语言模型落地的全流程解析

包括三部分内容：第一部分是关于 NeMo Framework。NeMo Framework 是 NVIDIA 大语言模型的全栈解决方案，它通过不同组件完成生成式 AI 各个环节的任务，包括数据预处理、分布式训练、模型微调、模型推理加速及部署（Ten...

生成式AI 2024-03-18 人工智能

932阅读

LLM4Decompile官网体验入口 AI代码反编译工具免费使用下载地址

LLM4Decompile是一个开源项目，旨在创建并发布第一个专门用于反编译的LLM（大型语言模型），并通过构建首个专注于可重编译性和可执行性的反编译基准测试来评估其能力。该项目通过编译大量C代码样本到汇编代码，然后使用这些数据对DeepSeek-Code...

AIGC 2024-03-18 人工智能

959阅读

微调大型语言模型进行命名实体识别

大型语言模型的目标是理解和生成与人类语言类似的文本。它们经过大规模的训练，能够对输入的文本进行分析，并生成符合语法和语境的回复。这种模型可以用于各种任务，包括问答系统、对话机器人、文本生成、翻译等。命名实体识别（Named Entity Recogn...

生成式AI 2024-03-18 人工智能

832阅读

基于ChatGPT的人型机器人Figure01据称能帮忙做家务

据报道，由OpenAI的ChatGPT驱动的最新自动人型机器人在外观上与科幻电影中的机器人形象有相似之处，但并非杀人机器。这款名为Figure01的新机器人能够执行基本的自主任务，并能够与人进行实时对话，这都是在ChatGPT的帮助下实现的。据Figur...

人工智能 2024-03-18 人工智能

813阅读

大模型能自己优化Prompt了，曾经那么火的提示工程要死了吗？

2022 年底，ChatGPT 上线，同时引爆了一个新的名词：提示工程（Prompt Engineering）。简而言之，提示工程就是寻找一种编辑查询（query）的方式，使得大型语言模型（LLM）或 AI 绘画或视频生成器能得到最佳结果或者让用户能绕...

人工智能 2024-03-18 人工智能

1019阅读

超详细！AIGC面试系列大模型基础(1)

关于我从2022年末开始接触AIGC，便一直紧跟最近技术与实践落地。期间参与copilot项目研发，落地了多个垂类AIGC大模型应用，熟悉各种AIGC相关技术如Agent，Langchain，chatdoc，向量数据库等。关于本系列请你认真看完...

生成式AI 2024-03-18 人工智能

3063阅读

重磅！谷歌正式推出开源大语言模型 Gemma，声称超越 Meta Llama-2 竞品

击上方关注 “终端研发部” 设为“星标”，和你一起掌握更多数据库知识 AI 开源之战打响！作为曾经AI领域扛把子的谷歌，这两年多来，风头几度被抢，一直处于被压着打的境地，，昨天Gemma的发布，预示着谷歌登上开源大模型“铁王...

人工智能 2024-03-17 人工智能

956阅读

微软广告和网络服务CEO承认OpenAI的Sora将加入Copilot,但需要一些时间

事情的起因是一名网友询问 Sora 是否会加入 Copilot，微软广告和网络服务CEO首席执行官——Mikhail Parakhin 回应说：“最终，但这需要时间。”毕竟投了几十个亿美金进去，不亏是金主爸爸。图为Mikhail Parakhi...

人工智能 2024-03-15 人工智能

804阅读

【AIGC调研系列】大模型的system prompt破解方法汇总

本文不提供具体方法，只汇总！！！大模型的system prompt破解方法主要包括提示注入（prompt injection）、命令注入、提示自动迭代精炼（Prompt Automatic Iterative Refinement, PAIR）等技术。...

生成式AI 2024-03-15 人工智能

2177阅读

Meta两个豪华AI集群曝光：每个配备2.4万块英伟达H100，价值几十亿

3月13日消息，美国时间周二，Facebook母公司Meta公布了两个数据中心规模新集群的技术细节，它们各自拥有超过2.4万个GPU，并在硬件、网络、存储、设计、性能和软件等方面上，专为支持大型语言模型如Llama 3进行训练而深度优化。这两个新集群基...

人工智能 2024-03-13 人工智能

887阅读

ShellGPT官网体验入口 AI命令行工具应用软件下载地址

ShellGPT是一个利用AI大型语言模型的强大能力，通过命令行界面提供辅助的工具，使用户能够通过自然语言指令来执行任务，提高工作效率和效率。需求人群主要适用于开发者和高级用户，特别是那些希望在命令行环境中利用AI提高生产力的用户。点击前往ShellG...

人工智能 2024-03-13 人工智能

932阅读

揭开LLM智慧涌现的面纱：OpenAI开源调试工具Transformer Debugger深入LLM的神经元秘密

在人工智能的浪潮中，大型语言模型（LLM）以其惊人的语言理解和生成能力成为了研究和应用的热点。从简单的文本分类到复杂的自然语言理解，LLM的应用领域不断扩展，涵盖了机器翻译、情感分析、自动摘要、聊天机器人等多个方面。随着模型规模的增长，它们的内部工作机制...

AIGC 2024-03-13 人工智能

875阅读

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B 简介环境配置环境搭建依赖安装代码及模型权重拉取拉取 Chinese-LLaMA-Alpaca 拉取 llama-30b...

大数据 2024-03-13 人工智能

847阅读

谷歌“窃取”GPT-3.5模型关键信息:成本低至150元，调用API即可得手

谷歌最新研究揭示了一种攻击大型语言模型的方法，成功窃取了OpenAI GPT-3.5-turbo模型的关键信息。根据谷歌的声明，他们不仅还原了OpenAI大模型的整个投影矩阵，还获得了确切的隐藏维度大小，而这一切只需不到2000次巧妙的API查询，成本低至...

大数据 2024-03-12 人工智能

802阅读

仅一行命令本地 CPU 环境快速上手 Google 开源大模型 Gemma

Google Gemma 是什么？ 2月底 Google 发布的 Gemma 相比自家的 Gemini 更加轻量级，不仅可以在笔记本电脑上运行，而且还免费可商用，支持中文，相比其他开源在各个方面都占了上风。科技巨头出品、领先地位、全面对外开放、免费可商用...

人工智能 2024-03-12 人工智能

1230阅读

Sora和ChatGPT，文心一言，通义千问，都是AI模型，它们有什么不同点和相同点？

为什么从2月14日开始，sora这个模型，很多人就开始炒作，甚至有人已经开始收学费，一天干到200万利润，这简直不敢相信。那到，Sora和ChatGPT，文心一言，通义千问，都是AI模型，它们有什么不同点和相同点？ ChatGPT：ChatGPT是由Op...

生成式AI 2024-03-11 人工智能

1674阅读

关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答

文章目录关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答先总结一下 Q：LLM模型预训练前与提示词关系，LLM模型预训练后与提示词关系 Q：预训练用的数据集与提示词有什么异同 Q：为什么我看到的数据集结构和提示词结...

人工智能 2024-03-11 人工智能

1018阅读

【AIGC调研系列】inflection-2.5与其他模型相比的优势和劣势

Inflection -2.5作为一款升级的内部模型，其与其他模型相比的优势主要体现在以下几个方面：性能提升：Inflection -2.5被认为是世界上最好的语言模型之一，其性能可与GPT-4、Gemini等世界领先的大型语言模型相媲美[1]。这...

生成式AI 2024-03-11 人工智能

937阅读

大模型在复杂推理任务上潜力如何？多智能体互动框架ThinkThrice玩转剧本杀

剧本杀是一种广受欢迎的多角色扮演侦探游戏，要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理，玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类：平民的目标是找出隐藏在他们中间的凶手，而凶手则尽力隐藏自己的身份，避免...

人工智能 2024-03-11 人工智能

901阅读

挑战OpenAI的新模型免费上线，40%计算量性能逼近GPT-4

本周四，美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。据介绍，Inflection-2.5 将强大的 LLM 能力与 Inflection 标志性的「同理心微调」结合在一起，兼具高情商与高智商...

大数据 2024-03-09 人工智能

794阅读

前谷歌大佬离职创业，不到一年造出GPT3.5和Gemini Pro，惨痛忠告：GPU简直菜鸡，就像是买彩票！

作者 | Yi Tay 编译 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）你敢相信吗？一位前谷歌大佬，离职成立公司，不到一年，从头训练出了“GPT3.5”/“Gemini Pro”，注意，后者是多模态大模型！本文主人公Y...

生成式AI 2024-03-08 人工智能

879阅读

神经网络之父Hinton最新公开演讲：数字智能会取代生物智能吗？

Geoffrey Hinton教授，人称“人工智能教父”，他是英国皇家学会院士(FRS ，也是加拿大皇家学会院士( FRSC 和加拿大国家勋章(CC 获得者。牛津大学于2024年2月19日在谢尔顿剧院举办了年度Romanes讲座，Geoffrey Hi...

AIGC 2024-03-08 人工智能

1110阅读

联合国教科文组织:由OpenAI和Meta支持的AI工具存在性别歧视内容

联合国教科文组织发布的研究报告指出，由OpenAI和Meta算法推动的全球最广泛使用的人工智能（AI）工具存在性别歧视现象。该研究中，专家评估了两种算法以及OpenAI的GPT-2和GPT-3.5，这两者分别是人们熟知的聊天机器人ChatGPT的免费版本的...

大数据 2024-03-08 人工智能

1143阅读

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

如何在不到一年的时间里创办一家公司、筹集资金、购买芯片，并搭建出追赶 Gemini pro/GPT 3.5 的 LLM？很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇，但真正走完「从零开始」这一流程的人很少。我们普遍认为，储备技术人才是前提...

人工智能 2024-03-07 人工智能

836阅读