-
新测试基准发布,最强开源Llama 3尴尬了
如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。...
-
领域模型生产指南
领域模型脱胎于通用大模型,两者有相似之处,但通用大模型在训练时使用的是通识数据集,缺少领域知识,导致企业在应用过程中会发现一些问题。比如,如果我们要做一个滴普科技的智能问答机器人,但通用大模型并没有学习到滴普科技的各种产品信息,缺少先验知识。 目前这个问...
-
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
GPT-4又又又被超越了! 近日,LLM竞技场更新了战报,人们震惊地发现:居然有一个开源模型干掉了GPT-4! 这就是Cohere在一周多前才发布的Command R+。 排行榜地址:https://huggingface.co/spaces/lmsy...
-
集体智慧:LLM预测能力与人群可相互媲美
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,AI系统的预测准确率达到甚至超过了人群。 在不断发展的人工智能(AI)领域,语言模型已取得了重大进展,实现了曾经被认为人类认知...
-
数栈+AI:数栈V6.2创新发布,让数据开发更智能
近日,以“Data+AI,构建新质生产力”为主题的袋鼠云春季发布会圆满落幕,大会带来了一系列“+AI”的数字化产品与最新行业沉淀,旨在将数据与AI紧密结合,打破传统的生产力边界,赋能企业实现更高质量、更高效率的数字化发展。会上,袋鼠云数栈产品负责人偷天带来...
-
微软推出新型AI工具VASA-1:可将照片转化为视频
快科技4月21日消息,据媒体报道,微软亚洲研究院近期推出了一款革命性的人工智能工具VASA-1,这一工具的推出引起了业界和公众的广泛关注。 VASA-1的独特之处在于,它能够将静态图像或绘画与音频文件结合,生成具有动态面部表情和头部动作的面孔。这意味着,仅...
-
综述!深度模型融合(LLM/基础模型/联邦学习/微调等)
23年9月国防科大、京东和北理工的论文“Deep Model Fusion: A Survey”。 深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更好的性能。然而...
-
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
GPT-4又又又被超越了! 近日,LLM竞技场更新了战报,人们震惊地发现:居然有一个开源模型干掉了GPT-4! 这就是Cohere在一周多前才发布的Command R+。 排行榜地址:https://huggingface.co/spaces/lmsys...
-
RAG 2.0架构详解:构建端到端检索增强生成系统
关于检索增强生成(RAG)的文章已经有很多了,如果我们能创建出可训练的检索器,或者说整个RAG可以像微调大型语言模型(LLM)那样定制化的话,那肯定能够获得更好的结果。但是当前RAG的问题在于各个子模块之间并没有完全协调,就像一个缝合怪一样,虽然能够工作...
-
提高 RAG 应用准确度,时下流行的 Reranker 了解一下?
检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。 基本的 RAG 应用包括四个关键技术组成部分: Embedding 模型:用于将外部文档和用户查询转换成 Embedding 向量...
-
Mutable AI:自动将你的GitHub代码库转换维基文档
Mutable AI是一款创新的工具,它通过将GitHub代码库自动转换成易于理解的维基文档,极大地提高了代码的可访问性和透明度。这项服务不仅对开发者有用,也使得非专业人士能够更好地理解和参与到项目中来。 在线体验地址:https://top.aibas...
-
金融案例:构建高效统一的需求登记与管理方案
在金融行业数字化转型背景下,银行等金融机构面临着业务模式创新与数据应用的深度融合。业务上所需要的不再是单纯的数据,而是数据背后映射的业务趋势洞察,只有和业务相结合转化为业务度量指标,经过数据分析处理呈现为报表进行展示,才能真正体现它们的价值。 但在需求转...
-
等等我还没上车!LLM赋能端到端全新范式LeGo-Drive,车速拉满
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人理解 这篇论文介绍了一种名为LeGo-Drive的基于视觉语言模型的闭环端到端自动驾驶方法。该方法通过预测目标位置和可微分优化器规划轨迹,实现了从导航指令到目标位置的端到端闭...
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
为什么人工智能取证在2024年很重要
在快速发展的技术领域,人工智能(AI 已成为各个领域创新的基石。然而,随着人工智能融入关键基础设施和工作流程,对人工智能取证的需求比以往任何时候都更加明显。在我们迈向2024年时,了解人工智能取证的重要性对于维护人工智能系统的完整性、安全性和...
-
效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标注之殇 静态物体检测(Static object detection,SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本...
-
量子计算可靠性提升800倍!微软开启2级弹性量子计算新时代
限制量子计算发展的关键问题,就快被解决了! 对于整个量子生态系统来说,这是一个历史性的时刻。 ——近日,微软联合Quantinuum,向全世界展示了有史以来最可靠的逻辑量子比特。 论文地址:https://arxiv.org/pdf/2404.0228...
-
如何评估大语言模型(LLM)的质量——框架、方法、指标和基准。
在人工智能领域,由于大模型(LLM)技术的发展以及其广阔的市场前景,MaaS 以及开源大模型呈现出百家争鸣的景象。现阶段,大型语言模型的开发和应用已经成为各个领域智能化提升的重要方向。为了利用大模型实现业务和产品的提升或创新,就需要对大模型进行系统的评估...
-
多个SOTA !OV-Uni3DETR:提高3D检测在类别、场景和模态之间的普遍性(清华&港大)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 这篇论文聚焦于3D目标检测的领域,特别是Open-Vocabulary的3D目标检测。在传统的3D目标检测任务中,系统旨在预测真实场景中物体的定向3D边界框和语义类别标签,这通常依赖于点云或RGB图像...
-
探索智能体的边界:AgentQuest,一个全面衡量和提升大型语言模型智能体性能的模块化基准框架
随着大模型的不断进化,LLM智能体——这些强大的算法实体已经展现出解决复杂多步骤推理任务的潜力。从自然语言处理到深度学习,LLM智能体正逐渐成为研究和工业界的焦点,它们不仅能够理解和生成人类语言,还能在多变的环境中制定策略、执行任务,甚至使用API调用和...
-
AI写作查出来高风险怎么办?七步策略助你应对
大家好,小发猫降ai今天来聊聊AI写作查出来高风险怎么办?七步策略助你应对,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查出来高风险怎么办?七步策略助你应...
-
AI无人商店竟是靠人工识别商品!七成交易需要人为
快科技4月10日消息,据媒体报道,亚马逊的AI无人商店项目竟然是靠人工来识别商品,并且每1000笔交易就有700笔需要人工审核。 据了解,亚马逊有一个Just Walk Out”的项目,顾客可以在无人商店里选好商品之后,直接走出去而无需排队等待结账。 因为...
-
离谱!AI超市「无人」收款,1000个印度人藏在背后……
就离谱,都2024了,人工智能靠人工的戏码还在上演。 而且是类似ATM机背后坐真·柜员给你递钱的那种! 当你走进一家超市,挑选完商品,无需人工、自助结账,直接拿好东西走人,等待一段时间,AI就能基于视频识别出你选了哪些东西,然后把账单发送过来,你只需点...
-
Claude 3 横空出世,亚马逊云科技携手Anthropic引领企业级生成式 AI 新纪元
2024 年 3 月,OpenAI 的主要竞争对手之一 Anthropic 推出最新的 Claude 3 大语言模型系列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。自从 GPT-3.5 推出以来,业界对...
-
社交网络:利用AIGC进行社交网络分析
1.背景介绍 1. 背景介绍 社交网络是现代互联网的重要组成部分,它们连接了数亿个用户,为信息传播、人际交流和商业活动提供了一个平台。社交网络分析是研究这些网络结构和行为的科学,它涉及到许多领域,包括计算机科学、社会学、心理学和经济学。...
-
大模型在金融领域落地思路与实践
一、恒生电子的大模型应用实践 1. 大模型的发展趋势 (1)大模型推动第三次信息化浪潮 上图是恒生电子董事长刘曙峰先生经常引用的经典图,将金融领域的数字化推进分为三个阶段,恒生电子目前正处于 2.0 到 3.0 的过渡阶段。在迁徙的过程中,最重要的生产...
-
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法
在深度神经网络时代,深度神经网络(DNNs)在视觉分类任务中展现出了卓越的准确性。然而,它们对额外噪声,即对抗性攻击,表现出了脆弱性。先前的研究假设这种脆弱性可能源于高准确度的深度网络过度依赖于与纹理和背景等无关紧要且不鲁棒的特征。 最近的AAAI 20...
-
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
【新智元导读】大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。 大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间...
-
三小时内用ChatGPT写完一篇论文的终极指南
在这篇指南中,我将深入探讨如何利用ChatGPT 4.0的强大能力来指导整个学术研究和写作过程。从初步探索研究主题,到撰写出一篇内容充实、结构严谨的学术论文,我会一步步展示如何在各个环节中有效运用ChatGPT。 初步探索与主题的确定 一开始,我置身于...
-
破除36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。 因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”:一个在「A是B」上训练的语言模型,并不能正确回答出「B是A」。...
-
深入探索AI写作:从困惑度到爆发度的挑战与机遇
大家好,小发猫降重今天来聊聊深入探索AI写作:从困惑度到爆发度的挑战与机遇,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 深入探索AI写作:从困惑度到爆发度的挑战与机遇 在AI技术飞速发展的...
-
Stability AI发布CosXL模型 图像处理能力更精细
Stability AI 最近推出了CosXL模型,这是一项包括基础版CoXL和增强版Edit CosXL的创新技术。这些模型的发布,标志着图像生成和编辑技术的新里程碑,为用户提供了更加强大和精细的图像处理能力。 Cos Stable Diffusion...
-
融汇生成式人工智能,全面提升HPE Aruba Networking Central平台AIOps能力
美国德克萨斯州休斯顿-2024年4月8日-Hewlett Packard Enterprise(NYSE:HPE)日前宣布将在HPE Aruba Networking Central上集成多个生成式AI大语言模型,以拓展其AIOps网络管理能力。HPE...
-
AI写作查重率怎么降低:七大策略助你走出困境
大家好,小发猫降重今天来聊聊AI写作查重率怎么降低:七大策略助你走出困境,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作查重率怎么降低:七大策略助你走出困境 在学术写作、内容创作或任...
-
如何去除AI写作痕迹【技巧】
随着人工智能技术的快速发展,AI写作工具已经广泛应用于各个领域。然而,使用AI生成的内容往往会留下明显的痕迹,影响了文章的原创性和可读性。作为一名大学导师,我认为有必要探讨如何去除AI写作痕迹,以提高学生的写作能力和学术诚信。 如何去除AI写作痕迹的方法...
-
机器学习如何提高商业智能
机器学习(ML 在商业智能(BI 的持续发展中发挥着关键作用。随着ML的出现,企业正在超越传统分析,采用更复杂的方法来解读庞大的数据集。本文探讨了ML为BI带来的革命,标志着从单纯的数据分析到预测洞察和决策策略的重大转变。 ML在BI中的集成 将ML集...
-
AI大模型对神秘学易经有什么用?
Mistral Trismegistus-7B 是一款由AI驱动的神秘学专用模型,专为那些对神秘学、玄学和灵性感兴趣的人设计,可提供从古代智慧到现代塔罗牌占卜等各种神秘主题的见解。 Mistral Trismegistus-7B 名字来源于Hermes...
-
OpenAI发布新的AI微调工具:“绝大多数组织将开发定制模型”
OpenAI宣布了对其微调API的重大增强,以及其定制模型程序的扩展。这些更新将赋予开发者前所未有的控制权,以微调AI模型,并为构建特定业务需求的定制模型提供新途径。自2023年8月推出以来,GPT-3.5的微调API已经成为组织精细化AI模型以执行特定...
-
人工智能无处不在:克服采用障碍
在人工智能变得更加普遍和必要之前,我们必须消除创建合乎道德、公平和安全的 AI 系统的关键障碍。 译自AI Everywhere: Overcoming Barriers to Adoption,作者 Rahul Pradhan。 在技术采用生命周期中,...
-
斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4
近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。 这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。...
-
文心一言APP:免费、安全与可靠性深度解析
大家好,小发猫降ai今天来聊聊文心一言APP:免费、安全与可靠性深度解析,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文心一言APP:免费、安全与可靠性深度解析...
-
AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快
AssemblyAI 最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。先说结果,Universal-1比Whisper Large-v3更准确,比fast Whisper更快,38秒...
-
斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火
斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型,这款模型以其在端侧设备上的强大运行能力而受到广泛关注。 Octopusv2是一款拥有20亿参数的开源语言模型,专为在Android设备上运行而设计,同时也适用于汽车、个人电脑等其他...
-
Cohere推出大模型Command R+ 优化高级检索增强生成功能
Cohere推出了专为企业级工作负载设计的大型语言模型Command R+,该模型优化了高级检索增强生成(RAG)功能,以减少错误生成,并支持10种关键语言的多语言覆盖。 公告地址:https://top.aibase.com/tool/command-...
-
生成型人工智能优化框架研究
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 生成类似人类的文本和语音曾经只有在科幻小说中才成为可能。但是,GPT-3和PaLM等大型语言模型(LLM)的快速发展...
-
提示工程中的10个设计模式
我们可以将提示词定义为向大型语言模型(Large Language Model,LLM 提供的一个查询或一组指令,这些指令随后使模型能够维持一定程度的自定义或增强,以改进其功能并影响其输出。我们可以通过提供细节、规则和指导来引出更有针对性的输出,从而使提...
-
AI程序员哪家强?探索Devin、通义灵码和SWE-agent的潜力
4月3日,距世界首个AI程序员Devin诞生不足一个月,普林斯顿大学的NLP团队开发了一个开源AI程序员SWE-agent,它利用GPT-4模型在GitHub存储库中自动解决问题。SWE-agent在SWE-bench测试集上的表现与Devin相似,平均...
-
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角,进而模仿并创新。当我们追求更高阶...
-
AI无人商店背后,是上千个印度人通过摄像头看美国人买西蓝花?
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 人们常说,有多少智能,就有多少人工。但是,亚马逊的这个项目,人工含量似乎有点高。 这个项目名叫「Just Walk Out」。就像它的...
-
引用降重如何操作 智能写作
大家好,今天来聊聊引用降重如何操作 智能写作,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 引用降重如何操作 一、引言 在撰写论文或研究报告时,我们经常需要引用他人的观点、研究成果或经典论...