-
Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航&ETH
大模型力大砖飞,让LLaMA3演绎出了新高度: 超15T Token数据上的超大规模预训练,既实现了令人印象深刻的性能提升,也因远超Chinchilla推荐量再次引爆开源社区讨论。 与此同时,在实际应用层面上,另一个热点话题也浮出水面: 资源有限场景下...
-
癌症早筛,这回轮到中国AI表演了
中国AI,再次吸引大洋彼岸关注。 日前,斯坦福大学发布了《2024年AI指数报告》,透露2023年美国人工智能投资额为672亿美元,是中国的约8.7倍;其中,阿里达摩院(湖畔实验室)医疗AI凭借在大规模胰腺癌早筛上的突破,成为唯一来自中国科技公司的AI亮点...
-
LinkedIn在利用大型语言模型服务十亿用户中的收获
LinkedIn 在全球拥有超过10亿用户,不断挑战当今企业技术的极限。很少有公司能够像LinkedIn那样运营,或者拥有类似的大量数据资源。 对这个专注于商业和就业的社交媒体平台来说,将合格的候选人与潜在雇主连接起来,帮助填补职位空缺是其核心业务。同...
-
AI日报:会颠勺的国产机器人Astribot S1来了;Synthesia推能读懂文字情绪的数字人;OpenVoice V2版本发布;DeepFacelive让你在直播中实时换脸
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Synthesia推出新型数字...
-
如何在工业自动化中有效应用生成式AI?
围绕 ChatGPT、Bard、Bing Chat 和其他生成式人工智能(AI)工具的炒作正在增加。AI工具推广者的承诺是,未经培训的用户可以使用这些工具来创建书面内容、计算机代码甚至法律文件。工业生成式AI战略应该包括具有自动化或应用专业知识(或两者兼...
-
人工智能和绿色技术如何帮助企业实现净零排放
在过去的几个月里,世界各地的人们都感受到了气候变化的影响。因此,企业必须集中精力满足日益增长的对环境责任的期望。现在,投资者、员工和合作伙伴比以往任何时候都更希望确保企业遵守其环境、社会和治理(ESG 承诺。 鉴于监管和信息披露要求的不断增加,有效的E...
-
量化、剪枝、蒸馏,这些大模型黑话到底说了些啥?
量化、剪枝、蒸馏,如果你经常关注大语言模型,一定会看到这几个词,单看这几个字,我们很难理解它们都干了些什么,但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们,理解其中的原理。 模型压缩 量化、剪枝、蒸馏,其实是通用的神经网络...
-
聊聊机器学习与人力资源管理碰撞什么火花?
前 言 近年来,机器学习领域取得了许多重大突破,人工智能技术驱动的人力资源管理服务产品也拥有一个庞大且充满活力的市场。越来越多的企业和政府机构逐渐开始思考将机器学习技术应用于人力资源管理,通过神经网络做出正确有效的决策,准确地预测人力资源管理的结果。...
-
天猫上线AI砍价功能 网友:AI的出击让我“脚趾扣地”
近日,小红书博主“脆皮钵钵柒”在平台上分享了自己在天猫App中的新奇体验。他在购物车页面偶然发现了一个“帮讲价”的按钮,出于好奇尝试点击后,出现了客服对话页面,AI主动出击,向商家提出“¥38.3卖不卖”的砍价要求,这一行为让博主感到十分尴尬,形容自己“脚...
-
商汤港股涨超34% 昨日推出AI大模型“日日新5.0”
商汤港股今日表现强势,涨幅显著扩大至34%,股价报0.820港元,总市值跃升至274.45亿港元。这一涨幅不仅彰显了市场对商汤科技的强烈信心,也反映出其业务的持续发展和强大潜力。 就在昨日,商汤科技在北京盛大举行新品发布会,正式推出了人工智能大模型“日日...
-
全面对标GPT-4 Turbo!商汤发布日日新5.0大模型
快科技4月23日消息,商汤科技在中国北京举行新品发布会,正式发布人工智能大模型日日新5.0”。 日日新5.0大模型采用了先进的MOE(Mixture of Experts)混合专家架构,这一架构的引入,使得模型在处理复杂任务时能够表现出更高的效率和准确性。...
-
开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了
虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉,也揭示了模型在真实性和透明度上仍然存在问题。 在模型生成错误回复内容时,如果能够「深入理解其背后运行机制」,或许可以解决模型的幻觉问题。 然而,随着深度神经网络...
-
ChatGPT能预测未来特定事件,准确率高达97%
贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。 研究人员使用了直接预测和未来叙述(Future Narrative)两种提示方法,进行...
-
新测试基准发布,最强开源Llama 3尴尬了
如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。...
-
领域模型生产指南
领域模型脱胎于通用大模型,两者有相似之处,但通用大模型在训练时使用的是通识数据集,缺少领域知识,导致企业在应用过程中会发现一些问题。比如,如果我们要做一个滴普科技的智能问答机器人,但通用大模型并没有学习到滴普科技的各种产品信息,缺少先验知识。 目前这个问...
-
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
GPT-4又又又被超越了! 近日,LLM竞技场更新了战报,人们震惊地发现:居然有一个开源模型干掉了GPT-4! 这就是Cohere在一周多前才发布的Command R+。 排行榜地址:https://huggingface.co/spaces/lmsy...
-
集体智慧:LLM预测能力与人群可相互媲美
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,AI系统的预测准确率达到甚至超过了人群。 在不断发展的人工智能(AI)领域,语言模型已取得了重大进展,实现了曾经被认为人类认知...
-
数栈+AI:数栈V6.2创新发布,让数据开发更智能
近日,以“Data+AI,构建新质生产力”为主题的袋鼠云春季发布会圆满落幕,大会带来了一系列“+AI”的数字化产品与最新行业沉淀,旨在将数据与AI紧密结合,打破传统的生产力边界,赋能企业实现更高质量、更高效率的数字化发展。会上,袋鼠云数栈产品负责人偷天带来...
-
微软推出新型AI工具VASA-1:可将照片转化为视频
快科技4月21日消息,据媒体报道,微软亚洲研究院近期推出了一款革命性的人工智能工具VASA-1,这一工具的推出引起了业界和公众的广泛关注。 VASA-1的独特之处在于,它能够将静态图像或绘画与音频文件结合,生成具有动态面部表情和头部动作的面孔。这意味着,仅...
-
综述!深度模型融合(LLM/基础模型/联邦学习/微调等)
23年9月国防科大、京东和北理工的论文“Deep Model Fusion: A Survey”。 深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更好的性能。然而...
-
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
GPT-4又又又被超越了! 近日,LLM竞技场更新了战报,人们震惊地发现:居然有一个开源模型干掉了GPT-4! 这就是Cohere在一周多前才发布的Command R+。 排行榜地址:https://huggingface.co/spaces/lmsys...
-
RAG 2.0架构详解:构建端到端检索增强生成系统
关于检索增强生成(RAG)的文章已经有很多了,如果我们能创建出可训练的检索器,或者说整个RAG可以像微调大型语言模型(LLM)那样定制化的话,那肯定能够获得更好的结果。但是当前RAG的问题在于各个子模块之间并没有完全协调,就像一个缝合怪一样,虽然能够工作...
-
提高 RAG 应用准确度,时下流行的 Reranker 了解一下?
检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。 基本的 RAG 应用包括四个关键技术组成部分: Embedding 模型:用于将外部文档和用户查询转换成 Embedding 向量...
-
Mutable AI:自动将你的GitHub代码库转换维基文档
Mutable AI是一款创新的工具,它通过将GitHub代码库自动转换成易于理解的维基文档,极大地提高了代码的可访问性和透明度。这项服务不仅对开发者有用,也使得非专业人士能够更好地理解和参与到项目中来。 在线体验地址:https://top.aibas...
-
金融案例:构建高效统一的需求登记与管理方案
在金融行业数字化转型背景下,银行等金融机构面临着业务模式创新与数据应用的深度融合。业务上所需要的不再是单纯的数据,而是数据背后映射的业务趋势洞察,只有和业务相结合转化为业务度量指标,经过数据分析处理呈现为报表进行展示,才能真正体现它们的价值。 但在需求转...
-
等等我还没上车!LLM赋能端到端全新范式LeGo-Drive,车速拉满
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人理解 这篇论文介绍了一种名为LeGo-Drive的基于视觉语言模型的闭环端到端自动驾驶方法。该方法通过预测目标位置和可微分优化器规划轨迹,实现了从导航指令到目标位置的端到端闭...
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
为什么人工智能取证在2024年很重要
在快速发展的技术领域,人工智能(AI 已成为各个领域创新的基石。然而,随着人工智能融入关键基础设施和工作流程,对人工智能取证的需求比以往任何时候都更加明显。在我们迈向2024年时,了解人工智能取证的重要性对于维护人工智能系统的完整性、安全性和...
-
效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标注之殇 静态物体检测(Static object detection,SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本...
-
量子计算可靠性提升800倍!微软开启2级弹性量子计算新时代
限制量子计算发展的关键问题,就快被解决了! 对于整个量子生态系统来说,这是一个历史性的时刻。 ——近日,微软联合Quantinuum,向全世界展示了有史以来最可靠的逻辑量子比特。 论文地址:https://arxiv.org/pdf/2404.0228...
-
如何评估大语言模型(LLM)的质量——框架、方法、指标和基准。
在人工智能领域,由于大模型(LLM)技术的发展以及其广阔的市场前景,MaaS 以及开源大模型呈现出百家争鸣的景象。现阶段,大型语言模型的开发和应用已经成为各个领域智能化提升的重要方向。为了利用大模型实现业务和产品的提升或创新,就需要对大模型进行系统的评估...
-
多个SOTA !OV-Uni3DETR:提高3D检测在类别、场景和模态之间的普遍性(清华&港大)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 这篇论文聚焦于3D目标检测的领域,特别是Open-Vocabulary的3D目标检测。在传统的3D目标检测任务中,系统旨在预测真实场景中物体的定向3D边界框和语义类别标签,这通常依赖于点云或RGB图像...
-
探索智能体的边界:AgentQuest,一个全面衡量和提升大型语言模型智能体性能的模块化基准框架
随着大模型的不断进化,LLM智能体——这些强大的算法实体已经展现出解决复杂多步骤推理任务的潜力。从自然语言处理到深度学习,LLM智能体正逐渐成为研究和工业界的焦点,它们不仅能够理解和生成人类语言,还能在多变的环境中制定策略、执行任务,甚至使用API调用和...
-
AI写作查出来高风险怎么办?七步策略助你应对
大家好,小发猫降ai今天来聊聊AI写作查出来高风险怎么办?七步策略助你应对,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查出来高风险怎么办?七步策略助你应...
-
AI无人商店竟是靠人工识别商品!七成交易需要人为
快科技4月10日消息,据媒体报道,亚马逊的AI无人商店项目竟然是靠人工来识别商品,并且每1000笔交易就有700笔需要人工审核。 据了解,亚马逊有一个Just Walk Out”的项目,顾客可以在无人商店里选好商品之后,直接走出去而无需排队等待结账。 因为...
-
离谱!AI超市「无人」收款,1000个印度人藏在背后……
就离谱,都2024了,人工智能靠人工的戏码还在上演。 而且是类似ATM机背后坐真·柜员给你递钱的那种! 当你走进一家超市,挑选完商品,无需人工、自助结账,直接拿好东西走人,等待一段时间,AI就能基于视频识别出你选了哪些东西,然后把账单发送过来,你只需点...
-
Claude 3 横空出世,亚马逊云科技携手Anthropic引领企业级生成式 AI 新纪元
2024 年 3 月,OpenAI 的主要竞争对手之一 Anthropic 推出最新的 Claude 3 大语言模型系列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。自从 GPT-3.5 推出以来,业界对...
-
社交网络:利用AIGC进行社交网络分析
1.背景介绍 1. 背景介绍 社交网络是现代互联网的重要组成部分,它们连接了数亿个用户,为信息传播、人际交流和商业活动提供了一个平台。社交网络分析是研究这些网络结构和行为的科学,它涉及到许多领域,包括计算机科学、社会学、心理学和经济学。...
-
大模型在金融领域落地思路与实践
一、恒生电子的大模型应用实践 1. 大模型的发展趋势 (1)大模型推动第三次信息化浪潮 上图是恒生电子董事长刘曙峰先生经常引用的经典图,将金融领域的数字化推进分为三个阶段,恒生电子目前正处于 2.0 到 3.0 的过渡阶段。在迁徙的过程中,最重要的生产...
-
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法
在深度神经网络时代,深度神经网络(DNNs)在视觉分类任务中展现出了卓越的准确性。然而,它们对额外噪声,即对抗性攻击,表现出了脆弱性。先前的研究假设这种脆弱性可能源于高准确度的深度网络过度依赖于与纹理和背景等无关紧要且不鲁棒的特征。 最近的AAAI 20...
-
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
【新智元导读】大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。 大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间...
-
三小时内用ChatGPT写完一篇论文的终极指南
在这篇指南中,我将深入探讨如何利用ChatGPT 4.0的强大能力来指导整个学术研究和写作过程。从初步探索研究主题,到撰写出一篇内容充实、结构严谨的学术论文,我会一步步展示如何在各个环节中有效运用ChatGPT。 初步探索与主题的确定 一开始,我置身于...
-
破除36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。 因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”:一个在「A是B」上训练的语言模型,并不能正确回答出「B是A」。...
-
深入探索AI写作:从困惑度到爆发度的挑战与机遇
大家好,小发猫降重今天来聊聊深入探索AI写作:从困惑度到爆发度的挑战与机遇,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 深入探索AI写作:从困惑度到爆发度的挑战与机遇 在AI技术飞速发展的...
-
Stability AI发布CosXL模型 图像处理能力更精细
Stability AI 最近推出了CosXL模型,这是一项包括基础版CoXL和增强版Edit CosXL的创新技术。这些模型的发布,标志着图像生成和编辑技术的新里程碑,为用户提供了更加强大和精细的图像处理能力。 Cos Stable Diffusion...
-
融汇生成式人工智能,全面提升HPE Aruba Networking Central平台AIOps能力
美国德克萨斯州休斯顿-2024年4月8日-Hewlett Packard Enterprise(NYSE:HPE)日前宣布将在HPE Aruba Networking Central上集成多个生成式AI大语言模型,以拓展其AIOps网络管理能力。HPE...
-
AI写作查重率怎么降低:七大策略助你走出困境
大家好,小发猫降重今天来聊聊AI写作查重率怎么降低:七大策略助你走出困境,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: AI写作查重率怎么降低:七大策略助你走出困境 在学术写作、内容创作或任...
-
如何去除AI写作痕迹【技巧】
随着人工智能技术的快速发展,AI写作工具已经广泛应用于各个领域。然而,使用AI生成的内容往往会留下明显的痕迹,影响了文章的原创性和可读性。作为一名大学导师,我认为有必要探讨如何去除AI写作痕迹,以提高学生的写作能力和学术诚信。 如何去除AI写作痕迹的方法...
-
机器学习如何提高商业智能
机器学习(ML 在商业智能(BI 的持续发展中发挥着关键作用。随着ML的出现,企业正在超越传统分析,采用更复杂的方法来解读庞大的数据集。本文探讨了ML为BI带来的革命,标志着从单纯的数据分析到预测洞察和决策策略的重大转变。 ML在BI中的集成 将ML集...
-
AI大模型对神秘学易经有什么用?
Mistral Trismegistus-7B 是一款由AI驱动的神秘学专用模型,专为那些对神秘学、玄学和灵性感兴趣的人设计,可提供从古代智慧到现代塔罗牌占卜等各种神秘主题的见解。 Mistral Trismegistus-7B 名字来源于Hermes...