bert 第3页 - AIGC资讯

Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天？

Cartesia 发布了一个名为 Sonic 的低延迟语音生成模型，该模型以其快速的推理速度和超低的延迟引起了广泛关注。Sonic 的延迟仅为135毫秒，能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音，Sonic 即可模仿说话者的韵律、语调...

生成式AI 2024-05-31 人工智能

959阅读

每天都看模型评分，但你真的了解吗？OpenAI研究员最新博客，一文读懂LLM评估

上周六，OpenAI研究院Jason Wei在个人网站上发表了一篇博客，讨论了他眼中「成功的语言模型评估」应该具备哪些因素，并总结出了阻碍好的评估在NLP社区获得关注的「七宗罪」。 Jason Wei在最近的斯坦福NLP研讨会上展示了这篇文章，Open...

生成式AI 2024-05-30 人工智能

895阅读

AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘—— 不仅能识别DNA、RNA与相应蛋白质之间的内在联系，在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。模型名为LucaOne，由阿里云...

人工智能 2024-05-30 人工智能

911阅读

OpenAI 首席执行官 Sam Altman 承诺捐出大部分财富

OpenAI CEO Sam Altman 宣布加入 “捐赠誓约” 名单，承诺捐赠超过一半的财富，这一决定是在 Altman 经历了一段动荡的时期后做出的。图源备注：图片由AI生成，图片授权服务商Midjourney 作为总部位于旧金山的公司 Chat...

生成式AI 2024-05-29 人工智能

795阅读

你所不知道的机器学习五大学派

机器学习是人工智能的重要分支，它赋予计算机从数据中学习的能力，并能够在无需明确编程的情况下改进自身性能。机器学习在各个领域都有着广泛的应用，从图像识别和自然语言处理到推荐系统和欺诈检测，它正在改变我们的生活方式。机器学习领域存在着多种不同的方法和理论，其...

生成式AI 2024-05-29 人工智能

1090阅读

全球100位顶尖商业大佬如何看AI

1956年，计算机科学家约翰·麦卡锡在达特茅斯会议上，首次提出了“人工智能（Artificial Intelligence）”。在此后近70年的时间里，人们对它既心怀憧憬，又充满警惕。乐观的观点认为，人工智能是堪比印刷术、电力和计算机的技术革命，它将带来...

大数据 2024-05-28 人工智能

804阅读

解读注意力机制原理，教你使用Python实现深度学习模型

本文分享自华为云社区《使用Python实现深度学习模型：注意力机制（Attention）》，作者：Echo_Wish。在深度学习的世界里，注意力机制（Attention Mechanism）是一种强大的技术，被广泛应用于自然语言处理（NLP）和计算机视...

AIGC 2024-05-28 人工智能

850阅读

从大模型（LLM）、检索增强生成（RAG）到智能体（Agent）的应用

引言随着人工智能技术的飞速发展，大型语言模型（LLM）、检索增强生成（RAG）和智能体（Agent）已经成为推动该领域进步的关键技术，这些技术不仅改变了我们与机器的交互方式，而且为各种应用和服务的开发提供了前所未有的可能性。正确理解这三者的概念及其之间...

人工智能 2024-05-28 人工智能

1026阅读

CoT提出者Jason Wei：大模型评估基准的「七宗罪」

在 CV 领域，研究者一直把李飞飞等人创建的 ImageNet 奉为模型在下游视觉任务中能力的试金石。在大模型时代，我们该如何评估 LLM 性能？现阶段，研究者已经提出了诸如 MMLU、GSM8K 等一些评估基准，不断有 LLM 在其上刷新得分。但这...

生成式AI 2024-05-27 人工智能

790阅读

芝大论文证明GPT-4选股准确率高达60%，人类股票分析师要下岗？AI大牛质疑数据污染

最近，各位业内大咖都被芝大的一篇论文震惊了。研究者发现，由GPT-4帮忙选择的股票，直接击败了人类！同时也pk掉了许多其他针对金融训练的机器学习模型。最让他们震惊的是，LLM可以在没有任何叙述上下文的情况下，就成功分析财务报表中的数字！图片论文地...

生成式AI 2024-05-27 人工智能

874阅读

一文深度剖析 ColBERT

近年来，向量搜索领域经历了爆炸性增长，尤其是在大型语言模型（LLMs）问世后。学术界开始重点关注如何通过扩展训练数据、采用先进的训练方法和新的架构等方法来增强 embedding 向量模型。在之前的文章中，我们已经深入探讨了各种类型的 embeddin...

大数据 2024-05-27 人工智能

901阅读

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

Hugging Face：自然语言处理的强大开源模型库在数字化时代，自然语言处理（NLP）技术的崛起为人工智能的发展注入了新的活力。而Hugging Face，作为这一领域的佼佼者，凭借其强大的模型仓库、易用的API以及活跃的社区支持，成为无数NL...

人工智能 2024-05-24 人工智能

1465阅读

LlamaFactory 进行大模型 llama3 微调，轻松上手体验学习

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集：《大模型面试宝典...

AIGC 2024-05-24 人工智能

1162阅读

万字长文专访IEEE Fellow丛京生院士：意外结缘EDA领域，寻找半导体技术「拐点」

2023年9月，IEEE集成电路与系统杂志（IEEE Circuits and Systems Magazine）的总编辑陈怡然教授和副主编陈凡教授非常荣幸地采访了丛京生院士。丛院士是世界电子设计自动化 (EDA 和高性能计算领域的杰出学者，本次采访...

大数据 2024-05-23 人工智能

911阅读

单模型斩获「蛋白质突变预测」榜一！西湖大学提出基于结构词表方法 | ICLR 2024 Spotlight

蛋白质结构相比于序列往往被认为更加具有信息量，因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破，大量的预测结构被发布出来供人研究使用，如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用F...

AIGC 2024-05-23 人工智能

877阅读

大模型“价格战”开打，给刚入商业化“佳境”的智谱AI提出了新挑战

1块钱买100万个tokens，为跟上Open AI，这家公司先给自己打个“骨折价”。 1 一比一复刻Open AI AI大模型在商业化路途中还在摸索，便已开打“价格战”。 5月15日，字节跳动宣布，豆包通用模型pro在企业市场的定价为0.0008元/千T...

AIGC 2024-05-21 人工智能

880阅读

150B token从头训练，普林斯顿Meta发布完全可微MoE架构Lory

不同于大多数模型使用字母缩略起名，论文作者在脚注中解释道，Lory是一种羽毛有彩虹颜色的鹦鹉，和「软MoE」的精神非常相似。论文的作者团队也可以称之为「明星阵容」。论文地址：https://arxiv.org/abs/2405.03133 主要作者...

生成式AI 2024-05-20 人工智能

920阅读

我们一起聊聊AI模型组合指南

实施需要周密的计划、资源管理以及采用现代部署实践和工具。译自A Guide to Model Composition，作者 Sherlock Xu。考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片，几分钟...

大数据 2024-05-20 人工智能

894阅读

路径规划概述：基于采样、搜索、优化全搞定！

本文经自动驾驶之心公众号授权转载，转载请联系出处。 1 决策控制与运动规划概述目前决策控制方法可以分为三类：sequential planning、behavior-aware planning、和end-to-end planning。 seq...

大数据 2024-05-17 人工智能

1157阅读

识别细胞也能用大模型了！清华系团队出品，已入选ICML 2024 | 开源

大模型带来的生命科学领域突破，刚刚再传新进展。来自清华系，使用大模型实现了单细胞身份识别，同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份，还具有很强的零样本分析能力，论文已被ICML 2024录⽤。 LangCell的数据集中包...

生成式AI 2024-05-16 人工智能

934阅读

一文读懂主流领先的 SLM（小型语言模型）

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - SLM(小型语言模型。在 AI 狂卷的浪潮中，LLM(大型语言模型无疑成为了整个互联网乃至科技界的焦点所在。以 GPT-3、BERT 等为代表的 LL...

人工智能 2024-05-16 人工智能

1089阅读

音乐人值得尝试的十大文本转音乐AI平台

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 从生成旋律到创作整首曲子，这些文本转音乐AI平台让我们得以一窥音乐创作的未来。新时代的应用程序如雨后春笋般涌现，音乐领域的Sora时...

AIGC 2024-05-11 人工智能

1180阅读

用AI陪玩家玩《我的世界》，华人AI创业者融资千万美金

近日，由华人 Robert Yang 创立的 AI 创企 Altera 推出了一个可以陪玩《Minecraft》的 AI Agent「Altera Bots」，并宣布完成900万美元种子轮融资，加上之前融到的200万美元，公司的融资额已经过了千万美金。与...

人工智能 2024-05-11 人工智能

980阅读

LLM 评估新纪元：Arthur Bench 全方位解读

一、传统文本评估面临的挑战近年来，随着大型语言模型（LLM）的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域，我们可能已经听说过一些方法，例如基于“单词出现”的评估方法，比如 BLEU，以及基于“预训练的自然语言处理模型”...

AIGC 2024-05-10 人工智能

851阅读

清华首个AI医院小镇来了！AI医生自进化击败人类专家，数天诊完1万名患者

斯坦福AI小镇曾火遍了全网，25个智能体生活交友，堪称现实版的「西部世界」。而现在，AI「医院小镇」也来了！最近，来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。论文地址：https://arxiv.org/pdf...

大数据 2024-05-09 人工智能

855阅读

算法在 58 画像平台建设中的应用

一、58 画像平台建设背景首先和大家分享下 58 画像平台的建设背景。 1. 传统的画像平台传统的思路来看，建设用户画像平台依赖数仓建模能力，整合多业务线数据，构建准确的用户画像；还需要数据挖掘，理解用户行为、兴趣和需求，提供算法侧的能力；最后，...

生成式AI 2024-05-09 人工智能

878阅读

超强Siri即将到来！苹果10篇重磅AI研究全总结，iOS 18关键一瞥

【新智元导读】一直以来，苹果在大模型、语音助手上的研究不断推陈出新，或许我们能够从中获得iOS18所具备AI能力的关键一瞥。「Siri太笨，根本无法与ChatGPT竞争」，前苹果工程师John Burkey曾对Siri的评价如此不堪。不过，诞生于11年...

AIGC 2024-05-08 人工智能

837阅读

使用LLMLingua-2压缩GPT-4和Claude提示

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 缩短发送给大型语言模型(LLM 的提示的长度可以减少推理时间并降低成本。这是提示压缩成为LLM研究的一个热门领域的原因。清华大学和微...

人工智能 2024-05-08 人工智能

951阅读

微调和量化竟会增加越狱风险！Mistral、Llama等无一幸免

大模型又又又被曝出安全问题！近日，来自Enkrypt AI的研究人员发表了令人震惊的研究成果：量化和微调竟然也能降低大模型的安全性！论文地址：https://arxiv.org/pdf/2404.04392.pdf 在作者的实际测试中，Mistra...

人工智能 2024-05-07 人工智能

844阅读

LeCun转发，AI让失语者重新说话！纽约大学发布全新「神经-语音」解码器

脑机接口（BCI）在科研和应用领域的进展在近期屡屡获得广泛的关注，大家通常都对脑机接口的应用前景有着广泛的畅享。比如，由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活，还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展，...

人工智能 2024-05-07 人工智能

865阅读

LeCun哈佛演讲PPT放出：唱衰自回归LLM，指明下一代AI方向

机器如何能像人类和动物一样高效地学习？机器如何学习世界运作方式并获得常识？机器如何学习推理和规划…… 当一系列问题被提出时，有人回答自回归 LLM 足以胜任。然而，知名 AI 学者、图灵奖得主 Yann LeCun 并不这么认为，他一直唱衰自回归 LL...

生成式AI 2024-05-06 人工智能

861阅读

苹果 AI 计划曝光：更智能的 Siri 即将到来

苹果在人工智能领域看似起步较晚，但最近的传闻和报告表明，苹果一直在等待时机，准备迈出重要一步。据报道，苹果正在与 OpenAI 和谷歌合作，同时也在研发自己的模型 Ajax 从苹果公布的 AI 研究来看，公司的 AI 战略逐渐清晰。近期有消息称，苹果计划...

生成式AI 2024-05-06 人工智能

815阅读

低成本LLM应用开发利器——开源FrugalGPT框架

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文将详细介绍一个LLM驱动型应用程序的成本节约架构FrugalGPT。大型语言模型为计算机科学开辟了一个新的前沿；然而，它们（截至...

人工智能 2024-05-06 人工智能

874阅读

Meta训AI，成本已超阿波罗登月！谷歌豪言投资超千亿美元，赛过OpenAI星际之门

【新智元导读】近日访谈中，LeCun亲口证实:Meta为购入英伟达GPU已经花费了300亿美元，成本超过阿波罗登月。相比之下，微软和OpenAI打造的星际之门耗资1000亿美元，谷歌DeepMind CEO Hassabis则放出豪言:谷歌投入的，比这个数...

大数据 2024-05-05 人工智能

878阅读

微软高管嫉妒谷歌在人工智能领域的领先地位投资 OpenAI 数十亿美元

在最新的反垄断案件中，微软高管对谷歌在人工智能领域的领先地位感到震惊和嫉妒。据《商业内幕》报道，微软首席技术官凯文·斯科特在一封2019年的电子邮件中表达了对谷歌快速增长的人工智能能力的担忧。他特别提到了对谷歌的BERT-large模型以及Gmail自动...

生成式AI 2024-05-02 人工智能

824阅读

小红书从记忆机制解读信息检索，提出新范式获得 EACL Oral

近日，来自小红书搜索算法团队的论文《Generative Dense Retrieval: Memory Can Be a Burden》被自然语言处理领域国际会议 EACL 2024 接收为 Oral，接受率为 11.32%（144/1271）。他...

大数据 2024-04-29 人工智能

989阅读

革新LLM微调之道：全方位解读PyTorch原生库torchtune的创新力量与应用价值

在人工智能领域，大语言模型（LLMs）正日益成为研究和应用的新热点。然而，如何高效、精准地对这些庞然大物进行调优，一直是业界和学术界面临的重要挑战。近期，PyTorch官方博客发布了一篇关于TorchTune的文章，引起了广泛关注。TorchTune作为...

人工智能 2024-04-26 人工智能

828阅读

自然语言处理(NLP)的工作原理

本文旨在揭开语言模型的神秘面纱，阐明其处理原始文本数据的基本概念和机制。它涵盖了几种类型的语言模型和大型语言模型，重点关注基于神经网络的模型。语言模型定义语言模型专注于生成类似人类的文本的能力。通用语言模型本质上是单词序列的统计模型或概率分布，用于...

人工智能 2024-04-24 人工智能

967阅读

新测试基准发布，最强开源Llama 3尴尬了

如果试题太简单，学霸和学渣都能考90分，拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布，业界急需一款更难、更有区分度的基准测试。大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard，引起广泛关注。...

AIGC 2024-04-23 人工智能

797阅读

时代2024最具影响力100人：黄仁勋、Bengio、纳德拉、王传福等人入选

刚刚，《时代》周刊发布了 2024 年度最具影响力的 100 人名单。在这份名单中，我们看到了很多熟悉的学者和企业家。微软公司 CEO、董事长萨蒂亚・纳德拉，比亚迪创始人王传福，英伟达创始人兼首席执行官黄仁勋，图灵奖得主 Yoshua Bengio...

AIGC 2024-04-22 人工智能

814阅读

4000万蛋白结构训练，西湖大学开发基于结构词表的蛋白质通用大模型，已开源

蛋白质结构相比于序列往往被认为更加具有信息量，因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破，大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用Fo...

人工智能 2024-04-22 人工智能

882阅读

EMNLP 2023｜利用LLM合成数据训练模型有哪些坑？

大家好，我是HxShine 今天我们将介绍EMNLP2023的一篇大模型（LLMs）生成文本分类任务合成数据的文章，标题是《Synthetic Data Generation with Large Language Models for Text Cla...

AIGC 2024-04-21 人工智能

1029阅读

你好，电动Atlas！波士顿动力机器人复活，180度诡异动作吓坏马斯克

波士顿动力Atlas，正式进入电动机器人时代！昨天，液压Atlas刚刚「含泪」退出历史舞台，今天波士顿动力就宣布：电动Atlas上岗。看来，在商用人形机器人领域，波士顿动力是下定决心要和特斯拉硬刚一把了。新视频放出后，短短十几小时内，就已经有一百...

大数据 2024-04-21 人工智能

862阅读

波士顿动力革新其人形机器人Atlas，引入电动马达

波士顿动力公司表示，新的电动版本的Atlas在人形机器人领域代表了一次重大飞跃，其性能远超过液压前身。据称，这种新机器人具有更优越的力量和更广泛的运动范围，使其能够在各种行业中处理更复杂的任务。例如，它采用了新的夹持技术，使其能够操纵比以前更重、形状...

人工智能 2024-04-21 人工智能

779阅读

波士顿动力新版人形机器人Atlas问世，纯电驱动

我们见证了新一代人形机器人 Atlas 的诞生。新机器人的视频一出，我们立即理解了波士顿动力为何退役已开发十多年的旧版 Atlas—— 人形机器人，现在应该有的是超越人类的灵活性。 Atlas 机器人躺平在实验室的地板上，看起来是仰卧，但突然关节反转站...

AIGC 2024-04-21 人工智能

819阅读

RAG 2.0架构详解：构建端到端检索增强生成系统

关于检索增强生成（RAG）的文章已经有很多了，如果我们能创建出可训练的检索器，或者说整个RAG可以像微调大型语言模型（LLM）那样定制化的话，那肯定能够获得更好的结果。但是当前RAG的问题在于各个子模块之间并没有完全协调，就像一个缝合怪一样，虽然能够工作...

人工智能 2024-04-20 人工智能

1050阅读

能对当今公司IT市场产生重大影响的六大趋势

“每个人都在谈论AI，”她说，并指出大多数公司已经将AI融入其业务中。“它已经被内置，或正在被内置进最大提供商的现有SaaS平台中。” 然而，随着AI的到来，也伴随着一定程度的恐惧和忧虑，Fox说。问题重重。“一个完全启用AI的公司会是什么样子?...

生成式AI 2024-04-12 人工智能

792阅读

大模型的学习 LLaMa和ChatGLM，minichatgpt4

LLaMa和ChatGLM，minichatgpt4 什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型，咋选？答：Bert 的模型由多层双向的Transformer编码器组成，由12层组成，768隐藏单元，12个head，总参数量...

大数据 2024-04-11 人工智能

954阅读

使用BERT的LLM提取摘要

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 在当今快节奏的世界里，充斥着太多的信息，并且难以处理。人们越来越习惯于在更短的时间内接收更多的信息，当他们不得不阅读大量的文件或书籍时...

生成式AI 2024-04-11 人工智能

997阅读

2024-03-26 AIGC-大模型学习路线

摘要: 2024-03-26 AIGC-大模型学习路线大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建...

大数据 2024-04-11 人工智能

2346阅读