语言模型第23页

Hume AI EVI对话人工智能体验入口情感大语言模型eLLM使用地址

Hume.AI专注于开发能够理解人类情感和表情的技术，提供表情测量API和自定义模型API，以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI，采用了情感大语言模型（eLLM）技术。点击前往Hume.AI EVI体验入口谁可以从H...

人工智能 2024-03-29 人工智能

1033阅读

密传！苹果牵手Anthropic，加码iOS 18，挑战ChatGPT！

整理丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）苹果公司被广泛传言正在与多家人工智能公司进行接洽，其中包括OpenAI、谷歌以及谷歌支持的创业公司Anthropic，旨在为预计今年晚些时候推出的iOS 18提供一系列全新AI特性支撑...

大数据 2024-03-29 人工智能

869阅读

DeepMind终结大模型幻觉？标注事实比人类靠谱、还便宜20倍，全开源

DeepMind 这篇论文一出，人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日，社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...

AIGC 2024-03-29 人工智能

772阅读

伊克罗德信息与墨奇科技战略合作，共创生成式AI新未来

3月28日伊克罗德信息在北京举办“AI引领未来探索大模型世界”活动，与墨奇科技、亚马逊云科技共同探讨生成式AI与向量数据库大力量，并与大家共同探讨人工智能大模型在各个行业的创新应用，为企业实现更高效、创新的数智化转型！活动现场，伊克罗德信息与墨奇科技...

AIGC 2024-03-29 人工智能

931阅读

X AI 发布Grok-1.5更新：性能显著提升支持128K上下文长度

昨天，X AI 发布了其最新的大型语言模型更新——Grok-1.5。该版本在编码和与数学相关的任务中表现出了显著的性能提升。据详细介绍，Grok-1.5在 MATH 基准测试中获得了50.6%的分数，在 GSM8K 基准测试中获得了90%的分数，这标志着...

AIGC 2024-03-29 人工智能

832阅读

知乎AI革命：智能搜索与实时问答的融合

在生成式人工智能（Generative AI）的信息技术跃迁背景下，如何看待知乎当下和未来，有三个基本的视角: 它是大语言模型预训练中文语料最重要来源之一，例如最近现象级的大模型聊天应用Kimi Chat，就以知乎为重要的训练资料来源（甚至是80%以上的...

AIGC 2024-03-29 人工智能

906阅读

大型语言模型如何教会自己遵循人类指令？

译者 | 李睿审校 | 重楼如今，人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ，也就是让大型语言模型教会自己遵循人类指令。指令微调(IFT ...

人工智能 2024-03-29 人工智能

946阅读

AI写作的未来：从困惑度与爆发度的视角探索

大家好，小发猫降ai今天来聊聊AI写作的未来：从困惑度与爆发度的视角探索，希望能给大家提供一点参考。降ai辅写以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有： AI写作的未来：从困惑度与爆发度的视角探索...

生成式AI 2024-03-29 人工智能

924阅读

（给自己挖坑中）一些还比较有趣的AIGC开源项目和部署教程

文章目录一、开源项目二、部署情况三、问题总结一、开源项目 https://www.naviai.cn/ AI 导航站 | 收录了国内外2000+优质AI工具，人工智能工具和模型的介绍及链接 https://zhuanla...

大数据 2024-03-29 人工智能

1117阅读

【AIGC调研系列】AIGC企业级模型Command-R介绍

Command-R与其他大语言模型的主要区别在于其专为企业级应用设计，特别是在检索增强生成（RAG）和工具使用方面。Command-R是一个350亿参数的高性能生成模型，具有开放式权重，能够支持多种用例，包括推理、摘要和问答[2]。它特别针对大规模生产工作...

大数据 2024-03-28 人工智能

1304阅读

今日Arxiv最热NLP大模型论文：Llama-2上下文扩大48倍的方法来了，港大发布，无需训练

引言：大语言模型的长上下文理解能力在当今的人工智能领域，大语言模型（Large Language Models，简称LLMs）的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要，因为它使得LLMs能够有效地应对各种应用场景，例如在...

大数据 2024-03-28 人工智能

970阅读

和 GPT-4 并列第一，LMSYS 基准测试显示 Claude-3 模型表现优异

3 月 28 日消息，根据 LMSYS Org 公布的最新基准测试报告，Claude-3 得分以微弱优势超越 GPT-4，成为该平台“最佳”大语言模型。 IT之家首先介绍下 LMSYS Org，该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内...

人工智能 2024-03-28 人工智能

870阅读

DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5

最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型，还在效率上有所突破。DBRX的基础和微调版本均已发布，为研究和商业应用提供了丰富的资源。 GitHub 链接：https:/...

生成式AI 2024-03-28 人工智能

912阅读

Zscaler发现企业AI采用率在不到一年的时间里飙升了600%，将数据置于风险之中

企业对AI/ML工具的依赖激增近 600%，从 2023年4月的5.21亿笔交易激增至2024年1月的每月31亿笔。对安全性的高度关注导致了所有AI/ML交易中有18.5%被阻止，仅在九个月内就增长了577%。 CISO及确保企业安全的人员有充分的理...

人工智能 2024-03-28 人工智能

968阅读

Hume AI发布对话AI——EVI：具备情感感知能力

Hume AI近日发布了一款具有情感感知能力的对话AI:EVI，这款产品采用了一种被称为情感大语言模型（eLLM）的多模态生成AI技术。情感大语言模型（eLLM）是一种结合了大型语言模型(LLMs 的语言理解能力和表情测量技术的情感感知能力的新技术。这种...

AIGC 2024-03-28 人工智能

878阅读

深夜里，女朋友给我讲解AI大语言模型的技术原理，搞得我又失眠了

随着ChatGPT的横空出世，各种大模型如雨后春笋一般涌现。女朋友最近研究了大模型，准备深夜给我讲解技术原理。可是我真的好困啊，但她说，AI最近那么火，你确定不想学习下吗？她说，大语言模型是一种人工智能技术，它可以理解和生成人类语言。这种模型的技术原...

生成式AI 2024-03-28 人工智能

870阅读

谷歌推出”自我发现“框架，极大增强GPT-4等大模型推理能力

随着ChatGPT的出现，大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面，面临内容不准确、安全等难题。谷歌Deepmind和南加州大学的研究人员提出了“SELF-DISCOVER”。这是一种用于大语言模型的通用框架...

生成式AI 2024-03-28 人工智能

822阅读

前谷歌工程师创业造AI芯片，要比英伟达好十倍！已融资2500万美元

3月28日消息，英伟达在AI芯片市场的主导地位激发了其他公司自主设计芯片的决心。尽管从头开始设计芯片充满挑战，耗时多年且成本高昂，通常以失败告终，但人工智能的巨大潜力驱使业界人士勇敢尝试。在这一背景下，两位前谷歌工程师共同创立了MatX。他们利用在谷...

大数据 2024-03-28 人工智能

821阅读

【关注】国内外经典大模型（ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、文心一言、千问等

以ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮，可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算...

AIGC 2024-03-27 人工智能

978阅读

Video-LLaMa:利用多模态增强对视频内容理解

在数字时代，视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务，不仅需要视觉和听觉信号的整合，还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的...

AIGC 2024-03-27 人工智能

883阅读

近屿智能成功完成A轮融资，打造独家AIGC工程师与产品经理学习路径图引发热议

近屿智能OJAC的发展历程与行业实力在2024年1月，上海近屿智能科技有限公司（简称近屿智能）宣布成功完成A轮融资。智望资本作为领头投资者，金沙江创投也参与了增资。这一里程碑事件不仅突显了近屿智能在人力资源技术领域的领先地位，也显示了投资者对其技术实力...

AIGC 2024-03-27 人工智能

966阅读

银行业中GenAI的规模化应用：选择优秀运营模式

GenAI正在给银行业带来革命性的变化，因为金融机构使用这项技术来为面向客户的聊天机器人增压，防止欺诈，并加快开发代码、准备推荐书草稿和汇总监管报告等耗时的任务。麦肯锡全球研究所估计，在整个全球银行业，GenAI每年可增加2000亿至3400亿美元的...

人工智能 2024-03-27 人工智能

1008阅读

智能体DS-Agent基于案例推理，让GPT-4数据科学任务接近100%

在大数据时代，数据科学覆盖了从数据中挖掘见解的全周期，包括数据收集、处理、建模、预测等关键环节。鉴于数据科学项目的复杂本质以及对人类专家知识的深度依赖，自动化在改变数据科学范式方面拥有极大的发展空间。随着生成式预训练语言模型的兴起，让大语言模型智能体处理...

人工智能 2024-03-27 人工智能

843阅读

Grammarly AI推出新AI功能，想用户提供智能建议

Grammarly近日推出了一项新的AI功能，旨在在您发送之前审查您的商业写作，并提供“战略性建议”，以使您的消息更清晰、更具影响力。无论您是在Gmail标签、文字处理器还是像Slack这样的聊天工具中撰写，这一新功能都旨在检测您何时大致完成一篇商业写作。...

生成式AI 2024-03-27 人工智能

994阅读

CLIP-BEVFormer：显式监督BEVFormer结构，提升长尾检测性能

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解目前，在整个自动驾驶系统当中，感知模块扮演了其中至关重要的角色，行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后，才能让自动驾驶系统中的下游规控模块做...

大数据 2024-03-26 人工智能

1243阅读

CIO分享：如何在企业中驾驭生成式AI

生成式AI正在大规模地为企业敞开创新的大门，但在这个新时代，高管层必须仔细监督对生成式AI的采用，以保证代码质量并减轻技术债务。生成式AI在起步阶段就已经改变组织并且给IT战略带来了深刻的影响。但是，虽然大型语言模型加速了工程敏捷性，但也打开了一道闸...

大数据 2024-03-26 人工智能

825阅读

等不及公开了！最新Sora模型细节揭秘：预计峰值需要72万块H100！每月至少4200块H100！缩放定律依旧有效！

作者 | Matthias·Plappert 翻译 | 言征出品 | 51CTO技术栈（微信号：blog51cto） OpenAI的Sora模型能够生成各种场景的极其逼真的视频，令世界惊叹不已。除了一篇公开的技术报告和TikTok上放出的酷炫视频，就...

AIGC 2024-03-26 人工智能

934阅读

清华和微软联合起来对提示词下手了！直接缩短80%，跟大模型对话的头疼系数直线下降！变相扩大了上下文窗口！

出品 | 51CTO技术栈（微信号：blog51cto）想一下，现在普通人调用个大模型有多别扭，你得一个个上传文件，然后再告诉它自己想要什么样的输出，最好给它一套优秀的模版，它才能给出个像样的回答。这就好比你自己的大脑都快想出答案来了，它只不过是帮...

生成式AI 2024-03-26 人工智能

868阅读

苹果再发多模态论文！陪我们走过十年的“Hey Siri”会被更智能的交互方式取代吗？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）全面发力AI的苹果，再出新研究！随着人工智能技术的发展，我们熟悉的“Hey Siri”或将成为历史。苹果团队最新出炉的论文《利用大型语言模型进行设备指向性语音检测的多模...

人工智能 2024-03-26 人工智能

884阅读

Stability AI发布最新代码模型升级版本Stable Code Instruct 3B

Stability AI 在昨晚发布了其最新的代码模型升级版本——Stable Code Instruct3B。这一开源项目是继之前工作的延续，暗示着SD3模型的开源发布应该能够顺利进行，尽管后续模型的发展情况还不太明朗。这个模型以3B的规模提供了业界领...

大数据 2024-03-26 人工智能

830阅读

AIGC实战——Transformer模型

AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结系列链接 0. 前言我们在 GPT (Generative Pre-trained Transfo...

AIGC 2024-03-26 人工智能

975阅读

突破性的百万级视频和语言世界模型：Large World Model~

本文经自动驾驶之心公众号授权转载，转载请联系出处。在探索如何让AI更好地理解世界方面，最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”，能够同时处理百万级长度的视频和语言序列，...

生成式AI 2024-03-26 人工智能

971阅读

在Raspberry Pi上运行本地LLM和VLM

译者 | 朱先忠审校 | 重楼在树莓派上使用Ollama的本地LLM和VLM（作者本人提供照片）前言有没有想过在自己的设备上运行自己的大型语言模型（LLM）或视觉语言模型（VLM）？你可能想过，但一想到从头开始设置，必须管理有关环境，还要下载正...

生成式AI 2024-03-26 人工智能

1220阅读

新研究：大语言模型“涌现”能力不令人惊讶也不难预测

3月26日消息，一项新的研究认为，大语言模型性能的显著提升并不令人意外，也并非无法预测，实际上这是由我们衡量人工智能性能的方式所决定的。两年前，450位研究人员在一个名为超越模仿游戏基准（Beyond the Imitation Game Bench...

AIGC 2024-03-26 人工智能

884阅读

通用图大模型HiGPT：一己之力建模任何图结构关系！来自港大数据智能实验室&百度

一个模型建模所有图结构关系—— 香港大学数据智能实验室最新图结构大模型来了。它叫HiGPT，由GraphGPT原班人马打造。后者是将图数据与大模型结合的代表方法之一：通过用图指令微调将图数据与大模型对齐，在下游任务上一度彰显了惊人的泛化性（Zero...

人工智能 2024-03-26 人工智能

860阅读

利用MindsDB和Anyscale微调Mistral 7B模型

在我们为面向客户的聊天应用制作大语言模型 (LLM 时，预训练模型往往是很好的起点，但随着时间的推移，您可能希望去控制该模型聊天的整体行为和给客户带去的“感觉”，而不仅仅由基本模型所能提供。对此，我们虽然可以通过提示工程（prompt engineeri...

生成式AI 2024-03-26 人工智能

1001阅读

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

在最近的研究中，视觉-语言-动作（VLA，vision-language-action）模型的输入基本都是2D数据，没有集成更通用的3D物理世界。此外，现有的模型通过学习「感知到动作的直接映射」来进行动作预测，忽略了世界的动态性，以及动作和动态之间的关...

生成式AI 2024-03-26 人工智能

897阅读

公司即将在AI上浪费数十亿美元，如何避免成为其中之一

“这是风险投资，不是冒险资金。”这是一位亲爱的朋友曾经在提出一个想法时从一位风投那里得到的充满爱意的回应，但当我们处于一项新技术的炒作周期阶段时，这种谨慎就不复存在了。毕竟，风投公司必须动用他们筹集的所有资金，错过一家大公司的成本要高于摇摆和错失的负面...

人工智能 2024-03-25 人工智能

898阅读

讨论下一个token预测时，我们可能正在走进陷阱

自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后，这一概念逐渐成为现代语言模型的核心部分。最近，围绕下一个 token 预测的讨论日趋激烈。然而，越来越多的人认为，以下一个 token 的预测为目标只能得到一个优秀的「即兴表演艺...

人工智能 2024-03-25 人工智能

924阅读

预见AI的下一个十年！从Suleyman到LeCun，三位大佬坐而论道：颠覆医疗保健业、图灵测试升级、AI与物理世界交融

编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）近日，人工智能界三位大佬聚首了！一位是最近“跳槽”微软的Inflection AI 联合创始人 Mustafa Suleyman、一位是Cohere的联合创始人兼首席执行官Aida...

大数据 2024-03-25 人工智能

794阅读

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

去年 8 月，两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI，总部位于日本东京。其中，Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you n...

人工智能 2024-03-25 人工智能

876阅读

使用GaLore在本地GPU进行高效的LLM调优

训练大型语言模型(llm ，即使是那些“只有”70亿个参数的模型，也是一项计算密集型的任务。这种水平的训练需要的资源超出了大多数个人爱好者的能力范围。为了弥补这一差距，出现了低秩适应(LoRA 等参数高效方法，可以在消费级gpu上对大量模型进行微调。 G...

大数据 2024-03-25 人工智能

835阅读

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

在自然语言处理中，有很多信息其实是重复的。如果能将提示词进行有效地压缩，某种程度上也相当于扩大了模型支持上下文的长度。现有的信息熵方法是通过删除某些词或短语来减少这种冗余。然而，作为依据的信息熵仅仅考虑了文本的单向上下文，进而可能会遗漏对于压缩至关...

生成式AI 2024-03-25 人工智能

924阅读

通用文档理解新SOTA，多模态大模型TextMonkey来了

最近，华中科技大学和金山的研究人员在多模态大模型 Monkey [1]（Li et al., CVPR2024）工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中，TextMonkey 处于国际领先地位，有潜力带来办公自动化、智慧教...

人工智能 2024-03-25 人工智能

887阅读

文心一言使用指南

文心一言是一款由百度推出的大语言模型，基于百度自主研发的知识和语义理解技术。以下是文心一言的使用指南： 1. 注册登录：首先，你需要注册并登录百度账号。如果你已经拥有百度账号，可以直接登录。 2. 创建实例：在百度AI开放平台（***/），选择“产品服...

大数据 2024-03-24 人工智能

1571阅读

AIGC 实战：Ollama 和 Hugging Face 是什么关系？

HuggingFace（拥抱脸）和Ollama都与**大型语言模型（LLMs）**有关，但它们的用途不同： HuggingFace： HuggingFace 是一个知名的平台，提供各种预训练的LLMs，包括流行的模型如GPT-3、BERT和...

生成式AI 2024-03-24 人工智能

2088阅读

Stable Diffusion老板也跑了！核心研发已集体辞职，“稳定AI”乱成一锅粥

好突然! 就在今天，Stability AI CEO宣布辞职了。 Emad Mostaque，既不再担任CEO，公司董事会也退出。消息一出，大伙都无比震惊。据悉，首席运营官Shan Shan Wong和首席技术官Christian Laforte...

人工智能 2024-03-24 人工智能

864阅读

基于腾讯云高性能应用服务HAI，快速搭建AI绘画环境介绍

目录 1、什么是HAI服务 2、HAI服务的优势 2.1 简单易用 2.2 快速部署 2.3 灵活性高 2.4 多种使用方式 2.5 算力种类丰富 3、应用场景 3.1 AI 作画 3.2 AI 写...

人工智能 2024-03-24 人工智能

888阅读

文心一言里面的内容会重复吗

大家好，今天来聊聊文心一言里面的内容会重复吗，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：文心一言里面的内容会重复吗一、引言随着人工智能技术的不断发展，文心一言作...

生成式AI 2024-03-23 人工智能

1916阅读

LangChain+llama.cpp+llama-cpp-python工程学习笔记（一）

LangChain 是一个开发由语言模型驱动的应用程序的框架，有以下特性。数据感知 : 将语言模型连接到其他数据源具有代理性质 : 允许语言模型与其环境交互 pip install langchain 报错ERROR: Could not...

AIGC 2024-03-23 人工智能

1294阅读