准确率第5页 - AIGC资讯

GPT-4通过图灵测试，胜率高达54%！UCSD新作：人类无法认出GPT-4

GPT-4可以通过图灵测试吗？当一个足以强大的模型诞生之后，人们往往会用图灵测试去衡量这一LLM的智能程度。最近，来自UCSD的认知科学系研究人员发现：在图灵测试中，人们根本无法区分GPT-4与人类！论文地址：https://arxiv.org...

人工智能 2024-05-20 人工智能

821阅读

揭秘Empirebook爬虫：探索数据抓取与处理的新世界

在当今信息化爆炸的时代，数据资源已经成为了各行各业竞相争夺的宝贵财富。随着大数据技术的飞速发展，爬虫作为一种能够自动抓取、处理和分析网络数据的工具，正日益受到人们的关注。在众多爬虫工具中，Empirebook爬虫凭借其强大的功能和灵活的应用场景，逐渐成为了...

大数据 2024-05-18 大数据

811阅读

单次支持38万字输入！腾讯混元推出256k长文模型，通过腾讯云向企业和个人开发者开放

AI大模型技术正成为推动高质生产力发展的关键力量，在与千行百业的融合中发挥着重要作用。腾讯混元大模型通过采用混合专家模型 (MoE 结构，已将模型扩展至万亿级参数规模，增加“脑”容量提升预测性能的同时，推动了推理成本下降。作为通用模型，腾讯混元在中文表...

人工智能 2024-05-17 人工智能

844阅读

CVPR'24 Oral | 一览纯稀疏点云检测器SAFDNet的前世今生！

写在前面&笔者的个人理解 3D点云物体检测对自动驾驶感知至关重要，如何高效地从稀疏点云数据中学习特征表示是3D点云物体检测面临的一个关键挑战。我们在本文中将会介绍团队发表在NeurIPS 2023的HEDNet和CVPR 2024的SAFDNet...

人工智能 2024-05-17 人工智能

981阅读

深入解析 Hyperf 爬虫：原理、应用与未来展望

在当今信息化社会，数据已经成为一种重要的资源，而爬虫技术作为获取数据的一种有效手段，广泛应用于各个领域。Hyperf 爬虫，作为基于 Hyperf 框架构建的爬虫系统，凭借其高效、稳定、易扩展等特点，逐渐成为爬虫领域的新宠。本文将对 Hyperf 爬虫进行...

大数据 2024-05-16 大数据

995阅读

识别细胞也能用大模型了！清华系团队出品，已入选ICML 2024 | 开源

大模型带来的生命科学领域突破，刚刚再传新进展。来自清华系，使用大模型实现了单细胞身份识别，同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份，还具有很强的零样本分析能力，论文已被ICML 2024录⽤。 LangCell的数据集中包...

生成式AI 2024-05-16 人工智能

934阅读

大模型真要取代程序员了？最危险的岗位是......

如今，随着大模型在编程、代码生成、自动化测试等领域展现出越来越强大的能力，一个引人深思的问题浮现出来：大模型会不会最终取代程序员的工作？有些人认为，世界上本就没有哪项工作是绝对安全的，机器取代人工本就是迟早的事。从 GitHub Copilot...

人工智能 2024-05-15 人工智能

810阅读

2024春季火山引擎FORCE原动力大会总结字节豆包9大模型详细介绍

在2024年春季火山引擎FORCE原动力大会上，字节跳动隆重推出了自主研发的“豆包大模型”系列，标志着该公司在人工智能领域的深厚积累和创新能力。这一系列大模型涵盖了豆包通用模型Pro、lite，以及角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文...

大数据 2024-05-15 人工智能

1736阅读

MIT最新！多模态LLM真的无所不能吗？大模型能解决一切难题吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解本文对自动驾驶领域内多模态大型语言模型（MLLMs）的应用进行了审慎的审视，并对一些常见的假设提出了质疑/验证，重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...

生成式AI 2024-05-15 人工智能

822阅读

思维链不存在了？纽约大学最新研究：推理步骤可省略

红极一时的思维链技术，可能要被推翻了！还在惊讶于大模型居然能够利用思维链分步骤思考？还在苦于不会写思维链提示词？来自纽约大学的研究人员表示：「没关系的，都一样」，推理步骤不重要，不想写提示词也可以不写，用省略号代替就行了。论文地址：https...

人工智能 2024-05-14 人工智能

840阅读

通义灵码技术解析，打造 AI 原生开发新范式

大家好，我是通义灵码的产品技术负责人陈鑫。过去有八年时间，我都是在阿里集团做研发效能，即研发工具相关的工作。我们从2015年开始做一站式 DevOps 平台，然后打造了云效，也就是将 DevOps 平台实现云化。到了2023年，我们明显感觉到大模型时代来...

人工智能 2024-05-13 人工智能

1095阅读

Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

Refuel AI 最近宣布推出两个新版本的大型语言模型（LLM），RefuelLLM-2和 RefuelLLM-2-small，这两个模型专为数据标注、清洗和丰富任务而设计，旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...

人工智能 2024-05-13 人工智能

832阅读

美国教授用2岁女儿训AI模型登Science！人类幼崽头戴相机训练全新AI

【新智元导读】为训练AI模型，纽约州立大学的一名教授Brenden Lake，竟让自己不到2岁女儿头戴相机收集数据!要知道，Meta训Llama3直接用了15万亿个token，如果Lake真能让AI模型学习人类幼崽，从有限的输入中学习，那LLM的全球数据荒...

AIGC 2024-05-13 人工智能

851阅读

智能笔记应用Voicenotes 支持AI搜索语音笔记

Voicenotes 是一款以录音为核心的智能笔记应用程序，它通过先进的人工智能技术，为用户提供了一个方便快捷的记录和搜索语音笔记的平台。核心功能: 录音功能:用户可以随时随地录制自己的想法和信息。 AI 转录:录音可以自动转录为文本，利用最新的人工...

人工智能 2024-05-13 人工智能

886阅读

70亿LLaMA媲美5400亿PaLM！MIT惊人研究用「博弈论」改进大模型｜ICLR 2024

遇到一个问题用不同表达方式prompt时，大模型往往会给出两种不同的答案。比如，「秘鲁的首都是什么」，「利马是秘鲁的首都吗」。对于这种回答不一致的问题，科学家们纷纷为大模型的「智商」担忧起来。正如了LeCun所言： LLM确实比狗积累了更多的事实知...

大数据 2024-05-13 人工智能

897阅读

优秀Agent智能体必学的几种设计模式，一学就会

大家好，我是老渡。昨天在公司听了清华大学智能产业研究院现场分享的AI医院小镇。图片这是一个虚拟世界，所有的医生、护士、患者都是由LLM驱动的Agent智能体，可以自主交互。它们模拟了整个诊病看病的过程，在涵盖主要呼吸道疾病的MedQA数据集子集上，...

生成式AI 2024-05-11 人工智能

965阅读

14 项任务测下来，GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力？

2023-2024年，以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型（Multimodal LLMs）已经在文本和图像等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。然而，对于这些模型的评测多集中于语言上的任务，...

人工智能 2024-05-11 人工智能

889阅读

当「软件研发」遇上 AI 大模型

作者：陈鑫（神秀）大家好，我是通义灵码的产品技术负责人陈鑫。过去有八年时间，我都是在阿里集团做研发效能，即研发工具相关的工作。我们从 2015 年开始做一站式 DevOps 平台，然后打造了云效，也就是将 DevOps 平台实现云化。到了 2023...

大数据 2024-05-10 人工智能

839阅读

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

把AlphaGo的核心算法用在大模型上，“高考”成绩直接提升了20多分。在MATH数据集上，甚至让7B模型得分超过了GPT-4。一项来自阿里的新研究引发关注：研究人员用蒙特卡洛树搜索（MCTS）给大语言模型来了把性能增强，无需人工标注解题步骤，也能...

AIGC 2024-05-09 人工智能

879阅读

清华首个AI医院小镇来了！AI医生自进化击败人类专家，数天诊完1万名患者

斯坦福AI小镇曾火遍了全网，25个智能体生活交友，堪称现实版的「西部世界」。而现在，AI「医院小镇」也来了！最近，来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。论文地址：https://arxiv.org/pdf...

大数据 2024-05-09 人工智能

855阅读

Agent Hospital：一个先进的虚拟AI医院模拟平台

Agent Hospital是一个创新的虚拟AI医院平台，它通过模拟医院中的所有真实医疗流程，为医疗教育和临床决策提供了一个高效的训练和研究环境。该平台涵盖了从疾病发生到治疗与康复的整个医疗过程，包括分诊、挂号、咨询、检查、诊断、治疗和随访等关键环节。...

人工智能 2024-05-08 人工智能

948阅读

OpenAI的图像检测系统识别DALL-E 3生成的AI图像准确率达98%

随着人工智能模型在创建自己的图像方面变得越来越出色，我们也需要提高对这类图像的检测能力。因此，OpenAI已经开发了一个程序，用于检测图像是否由人工智能生成。图源备注：图片由AI生成，图片授权服务商Midjourney 该系统在识别图像是否由 DALL...

大数据 2024-05-08 人工智能

846阅读

爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP

多层感知器（MLP），也被称为全连接前馈神经网络，是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过，因为它们是机器学习中用于逼近非线性函数的默认方法。但是最近，来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。...

AIGC 2024-05-07 人工智能

849阅读

LeCun转发，AI让失语者重新说话！纽约大学发布全新「神经-语音」解码器

脑机接口（BCI）在科研和应用领域的进展在近期屡屡获得广泛的关注，大家通常都对脑机接口的应用前景有着广泛的畅享。比如，由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活，还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展，...

人工智能 2024-05-07 人工智能

864阅读

MLP一夜被干掉！MIT加州理工等革命性KAN破记录，发现数学定理碾压DeepMind

一夜之间，机器学习范式要变天了！当今，统治深度学习领域的基础架构便是，多层感知器（MLP）——将激活函数放置在神经元上。那么，除此之外，我们是否还有新的路线可走？就在今天，来自MIT、加州理工、东北大学等机构的团队重磅发布了，全新的神经网络结构...

AIGC 2024-05-06 人工智能

937阅读

58行代码把Llama 3扩展到100万上下文，任何微调版都适用

堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。在32k起步，100k寻常的今天，这是故意要给开源社区留做贡献的空间吗？开源社区当然不会放过这个机会：现在只需58行代码，任何Llama 3 70b的微调...

大数据 2024-05-06 人工智能

840阅读

微软发布AI天气预测模型能精准预报未来30天天气

微软Start团队近日宣布，他们开发出了一种全新的数据驱动AI天气预测模型，该模型能够准确预测未来30天的天气情况。这一研究成果不仅在预报准确率上取得了显著提升，同时在计算效率上也实现了巨大突破。论文地址:https://arxiv.org/pdf/2...

大数据 2024-05-06 人工智能

893阅读

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

AI做数学题，真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现，即使不让AI写步骤，全用无意义的“……”代替，在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势，具体选择了什么token无...

生成式AI 2024-05-06 人工智能

767阅读

终于有人调查了小模型过拟合：三分之二都有数据污染，微软Phi-3、Mixtral 8x22B被点名

当前最火的大模型，竟然三分之二都存在过拟合问题？刚刚出炉的一项研究，让领域内的许多研究者有点意外。提高大型语言模型的推理能力是当前研究的最重要方向之一，而在这类任务中，近期发布的很多小模型看起来表现不错，比如微软 Phi-3、Mistral 8x2...

人工智能 2024-05-06 人工智能

869阅读

苹果推出理解、转化模型ReALM，性能超GPT-4

苹果的研究人员推出了一种创新模型ReALM，可将参考解析问题转化为语言建模问题，能极大提升AI助手处理很多描述复杂或模糊不清的内容。例如，我们网购时选好了橘子、鸭梨、苹果、橘子汽水、洗发水、短袖、拖鞋等物品，然后告诉AI助手只结算水果。这时传统的AI助手...

人工智能 2024-04-30 人工智能

886阅读

模型量化与量化在LLM中的应用｜得物技术

【图片出处：Knowledge Distillation: A survey,2021,p2】剪枝则是通过靠剪除模型中不重要的权重从而给模型“瘦身”，提高模型的推理效率，为了保证模型的能力，通常剪枝过程也需要伴随着模型基于训练数据的微调。根据剪除权重的...

人工智能 2024-04-30 人工智能

1004阅读

通过学习曲线识别过拟合和欠拟合

本文将介绍如何通过学习曲线来有效识别机器学习模型中的过拟合和欠拟合。欠拟合和过拟合 1、过拟合如果一个模型对数据进行了过度训练，以至于它从中学习了噪声，那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子，所以它会错误地分类一个看不见的...

人工智能 2024-04-29 人工智能

837阅读

大语言模型对汽车行业的影响和实践探索

汽车行业作为技术创新的重要领域，正迅速采纳大语言模型，如 GPT 系列，以推动行业的数字化转型。这些模型在提升车载智能系统的交互体验、优化客户服务、加速产品开发及市场营销策略方面展现出巨大潜力。通过具体应用案例分析，接下来我们一起揭示大语言模型如何为汽...

大数据 2024-04-28 人工智能

830阅读

癌症早筛，这回轮到中国AI表演了

中国AI，再次吸引大洋彼岸关注。日前，斯坦福大学发布了《2024年AI指数报告》，透露2023年美国人工智能投资额为672亿美元，是中国的约8.7倍;其中，阿里达摩院（湖畔实验室）医疗AI凭借在大规模胰腺癌早筛上的突破，成为唯一来自中国科技公司的AI亮点...

人工智能 2024-04-26 人工智能

817阅读

一文解决任何机器学习问题！

前言数据挖掘大神Abhishek Thakur，很多数据挖掘kaggler对他都非常熟悉，他在 Linkedin 发表了一篇名为Approaching (Almost Any Machine Learning Problem(几乎解决任何机器学习...

AIGC 2024-04-26 人工智能

911阅读

苹果卷开源大模型，公开代码、权重、数据集、训练全过程，OpenELM亮相

要说 ChatGPT 拉开了大模型竞赛的序幕，那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中，苹果似乎掀起的水花不是很大。不过，苹果最新放出的论文，我们看到其在开源领域做出的贡献。近日，苹果发布了 OpenELM，共四种变...

生成式AI 2024-04-25 人工智能

884阅读

ChatGPT能预测未来特定事件，准确率高达97%

贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授，基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。研究人员使用了直接预测和未来叙述（Future Narrative）两种提示方法，进行...

大数据 2024-04-23 人工智能

832阅读

集体智慧：LLM预测能力与人群可相互媲美

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在，AI系统的预测准确率达到甚至超过了人群。在不断发展的人工智能（AI）领域，语言模型已取得了重大进展，实现了曾经被认为人类认知...

AIGC 2024-04-22 人工智能

967阅读

Llama 3每秒输出800个token逼宫openAI！下周奥特曼生日或放出GPT-5？

【新智元导读】Llama3的开源，或将催生数十亿美元新产业。发布不到一周的时间，全网各种测试微调都开启了。甚至，Llama3在Groq上的输出速度实现了每秒800个token。 Llama3诞生之后便艳压群雄，开源界已无「模」能敌。甚至，让网友为Open...

生成式AI 2024-04-22 人工智能

811阅读

EMNLP 2023｜利用LLM合成数据训练模型有哪些坑？

大家好，我是HxShine 今天我们将介绍EMNLP2023的一篇大模型（LLMs）生成文本分类任务合成数据的文章，标题是《Synthetic Data Generation with Large Language Models for Text Cla...

AIGC 2024-04-21 人工智能

1029阅读

让玩家全程掌控游戏：自然语言指令驱动的游戏引擎到来了

对于每一位热爱打游戏的人而言，都曾经想过这样一个问题，「这游戏要是我来做就好了！」可惜的是，游戏开发有很高的门槛，需要专业的编程技巧。近日，来自上海交大的团队开展了一个名为「Instruction-Driven Game Engine, IDGE」的...

大数据 2024-04-21 人工智能

1087阅读

OpenAI提供新的微调和定制选项

微调在构建有价值的人工智能工具中起着至关重要的作用。这种使用更有针对性的数据集精炼预训练模型的过程可以使用户大大增加模型对专业内容的理解，允许用户为特定任务的模型增加现成知识。虽然这个过程可能需要时间，但与从头开始训练模型相比，它的成本效益通常要高三...

生成式AI 2024-04-20 人工智能

850阅读

Anthropic Claude 3 Opus基础模型在Amazon Bedrock上正式可用

北京——2024年4月17日亚马逊云科技宣布，在Amazon Bedrock上正式推出来自Anthropic的Claude 3 Opus模型，该模型是Claude 3家族中最智能的模型，在高度复杂的任务上表现卓越，并拥有惊人的流畅性和类似人类的理解能力...

人工智能 2024-04-17 人工智能

903阅读

InternLM2官网体验入口中文AI聊天机器人模型使用地址

InternLM2是一个面向中文和英文的大型多语言预训练语言模型。它具有语言理解、自然语言生成、多模式推理、代码理解等强大的能力。模型采用Transformer架构并进行海量数据的预训练，在长文本理解、对话、数学运算等多个方向上都达到了业界领先水平。该系列...

AIGC 2024-04-12 人工智能

893阅读

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

当下，大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势。业界已经出现了一批引人瞩目的代码大模型，比如 OpenAI 的 CodeX、谷歌 DeepMind 的 AlphaCode、HuggingFace 的 StarCoder，帮助程序员更迅捷...

AIGC 2024-04-10 人工智能

1061阅读

抱抱脸Open了OpenAI的秘密武器，网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF，被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline，罗列了25个关键实施细节。最终成功展示...

人工智能 2024-04-08 人工智能

831阅读

揭秘AI幻觉：GPT-4V存在视觉编码漏洞，清华联合NUS提出LLaVA-UHD

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力，成为如今最领先...

大数据 2024-04-07 人工智能

856阅读

斯坦福团队大模型Octopus v2火了：手机就能运行准确性超越GPT-4

近日，斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注，其20亿参数的模型一夜下载量超过2k。这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行，并在准确性和延迟方面表现超越了 GPT-4，同时将上下文长度减少了95%。...

生成式AI 2024-04-07 人工智能

1306阅读

超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 在大模型落地应用的过程中，端侧 AI 是非常重要的一个方向。近日，斯坦福大学研究人员推出的 Octopus v2 火了，受到了开发者社...

AIGC 2024-04-07 人工智能

889阅读

斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火

斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型，这款模型以其在端侧设备上的强大运行能力而受到广泛关注。 Octopusv2是一款拥有20亿参数的开源语言模型，专为在Android设备上运行而设计，同时也适用于汽车、个人电脑等其他...

人工智能 2024-04-07 人工智能

1304阅读