-
医疗行业漫长的数字化之路迎来AI助力
宾夕法尼亚大学卫生系统在其Penn Medicine BioBank中拥有大量匿名的患者数据,SVP兼CIO的Michael Restuccia的团队看到了利用这些数据造福研究医院患者的机会。 “我们讨论了如何将AI研究中的一些创新应用到诊所中去。”...
-
中国气象局发布三个AI气象大模型系统:命名风清、风雷、风顺
快科技6月19日消息,中国气象局最新发布了三个AI气象大模型系统,分别是:风清”、风雷”、风顺”。 风清”是人工智能全球中短期预报系统,由中国气象局联合清华大学组建攻关团队,在大模型预报核心技术、预报精准程度上寻求突破,构建了风清大模型。 该模型采用可扩展...
-
把整个地球装进神经网络,北航团队推出全球遥感图像生成模型
北航的研究团队,用扩散模型“复刻”了一个地球? 在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富多样的“平行场景”。 而且地形、气候、植被等复杂的地理特征,也全都考虑到了。 受Google Earth启发,北航的研究团队从俯拍视角出发,将...
-
ICML2024高分!魔改注意力,让小模型能打两倍大的模型
改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。 DCMHA解除...
-
中国首个!中国电信发布星辰超多方言混说语音大模型
快科技5月26日消息,日前,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型星辰超多方言语音识别大模型。 该大模型解决了单一模型只能识别特定单一方言的痛点,能同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言...
-
与机器对话:揭示提示工程的十个秘密
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 提示的力量十分神奇,我们只需抛出几个近似人类语言的单词,就能得到一个格式和结构都良好的答案。没有什么话题是晦涩难懂的,没有什么事实是触...
-
Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4
Claude 3的诞生又一次震惊了全世界。 Claude 3 Opus,Claude 3中最智能的模型,在大多数常见的人工智能系统评估基准测试中表现优异,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等。 图片...
-
7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力
图神经网络(GNNs)擅长利用图的结构信息进行推理,但它们通常需要特定于领域的调优才能达到峰值性能,这阻碍了它们在不同任务之间的泛化性。 相比之下,基于大型语言模型(LLM)的图推理具有更强的跨任务和泛化能力,但它们在特定任务上的性能往往逊色于专用的图...
-
AnyGPT:实现任意模态输入到任意模态输出
近日,复旦大学、上海人工智能实验室等机构联合推出了一款名为AnyGPT的多模态大语言模型,该模型在处理语音、文本、图像和音乐等多种模态输入时,可以生成任何模态的输出。 AnyGPT采用离散表示技术,通过在各模态输入上进行离散标记,实现了多模态信息的统一处...
-
万元预算打造高质量13B私有模型,Colossal-AI LLaMA-2 开源方案再升级
几个月前,Colossal-AI 团队仅利用8.5B token数据、15小时、数千元的训练成本,成功构建了性能卓越的中文LLaMA-2 7B 版本模型,在多个评测榜单性能优越。 在原有训练方案的基础上,Colossal-AI 团队再次迭代,并通过构建更...
-
万事达卡推出反欺诈AI模型 金融科技拥抱生成式AI
全球支付巨头万事达卡(MasterCard 日前表示,已构建自己的专有生成式AI模型,以帮助其信用卡网络中的数千家银行检测并根除欺诈交易。 该公司表示,其开发的先进AI模型Decision Intelligence Pro将允许银行机构更好地实时评估网...
-
中文创意写作能力超GPT-4,「最会写」的中文大模型Weaver来了
ChatGPT 等通用大模型支持的功能成百上千,但是对于普通日常用户来说,智能写作一定是最常见的,也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字,但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域,大模型...
-
华科大发布多模态大模型新基准 覆盖五大任务
近期,华中科技大学等机构发布了一项关于多模态大模型(LMMs)的全面评估新基准,旨在解决多模态大模型性能评估的问题。这项研究涉及了14个主流多模态大模型,包括谷歌Gemini、OpenAI GPT-4V等,覆盖了五大任务、27个数据集。然而,由于多模态大模...
-
2024 年,3 项技术将为生成式人工智能提供帮助
随着 ChatGPT 惊艳的首年即将落幕,生成式人工智能(genAI)与大型语言模型(LLM)无疑已成为引人瞩目的技术焦点。然而,在企业的黄金时期,它们是否已具备投入使用的能力呢?ChatGPT 所遭遇的挑战众所周知,其在回答问题时的准确性尚待提高。尽...
-
CodeOps:使用LLM和模块化编码加快开发进程
译者 | 布加迪 审校 | 重楼 2009年,DevOps(开发运维)作为一种运维模型而出现,适用于想要充分发挥敏捷软件开发方法潜力的团队。它使这些团队能够尽快地构建和部署,为快速、迭代的开发建立一种新的范式。 随之而来的是全球软件开发的爆炸式增长,D...
-
数据治理能解决AI疲劳问题吗?
数据治理和AI疲劳听起来像是两个不同的概念,但两者之间有着内在的联系。为了更好地理解它,让我们从它们的定义开始。数据治理 长期以来,它一直是数据行业的核心焦点。 Google说得很好——“数据治理是你为确保数据安全、私有、准确、可用和可用所做的一切,它...
-
Raia官网体验入口 AI团队构建与自动化工具免费使用地址
Raia是一个先进的AI工具,专注于构建基于人工智能的团队,提高工作效率和战略决策能力。它具备学习和执行任务的能力,能够在不同行业和应用场景中发挥重要作用,同时帮助团队降低成本、加快工作进度,并提供深入的洞察和策略建议。 点击前往Raia官网体验入口 谁...
-
OpenAI推出GPT Store,领导层纷争后的新业务
ChatGPT Team是OpenAI企业版产品的较小版本,面向用户少于150人的企业,年费为每个用户每月25美元,或每个用户每月30美元,它包括一个共享工作区,并允许团队构建自己的GPT。 在推出新的使用级别之前,ChatGPT Enterpri...
-
攻克图像「文本生成」难题,碾压同级扩散模型!两代TextDiffuser架构深度解析
近年来,文本生成图像领域取得了显著进展,尤其是基于扩散(Diffusion)的图像生成模型在细节层面上展现出逼真的效果。 然而,一个挑战仍然存在:如何将文本准确地融入图像。 生活中存在大量的「含文本图像」,从广告海报到书籍封面,再到路牌指示,都包含了重要...
-
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理
给你一首曲子的音频和一件乐器的 3D 模型,然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色,看它是钢琴曲还是小提琴曲又或是来自吉他;同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗? 实际上,...
-
最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了
目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索,如下排行榜所示。 看起来,GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的...
-
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布
在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 S...
-
如何有效减少 AI 模型的数据中心能源消耗?
在让人工智能变得更好的竞赛中,麻省理工学院(MIT)林肯实验室正在开发降低功耗、高效训练和透明能源使用的方法。 在 Google 上搜索航班时,您可能已经注意到,现在每个航班的碳排放量估算值都显示在其成本旁边。这是一种告知客户其对环境影响的方式,并让他...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
人工智能推动“电脑嗅觉”用于昆虫控制
机器嗅觉初创公司Osmo于2023年1月成立,获得由Lux Capital和Google Ventures领投的 6000万美元A轮资金。Osmo将机器学习、数据科学、心理物理学、嗅觉神经科学、电气工程和化学融合在一种多学科的气味数字化方法中。 Osm...
-
AI视野:ChatGPT和API发生重大中断;GPTs分阶段推出计划延迟;中国第二批11个大模型备案获批;阿里将开源720亿参数大模型
???AI新鲜事 ChatGPT和API发生重大中断! 11月9日凌晨,OpenAI在官网发布,ChatGPT和API发生重大中断,导致全球所有用户无法正常使用,宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复,但仍然不稳定,会继续进行安全监控...
-
用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单
在现代社会,信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里,声音、视频、文字和深度图等模态信息相互交织,共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中,同样也是机器理解世界所必须面对的挑战。 如何让机器像人类...
-
给终端装上大模型,对打工人来说究竟是福还是孽?
各行业的打工人从最开始担心被AI替代,到现在的“真香”,已经开始能够利用这一“利器”在工作中不断提高效率,大胆创新。根据速途网与大模型之家联合发布的报告显示,到 2023 年,全球大模型市场规模将达到 210 亿美元,到 2028 年,其规模将增长到...
-
比Transformer更好,无Attention、MLPs的BERT、GPT反而更强了
从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型,Transformer 正以锐不可当之势席卷这个世界,但人们也不禁会问:Transformer 是唯一选择吗? 斯坦福大学和纽约州立大学布法...
-
Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树
到底什么才是LLM长上下文模型的终极解决方案? 最近由普林斯顿大学和Meta AI的研究者提出了一种解决方案,将LLM视为一个交互式智能体,让它决定如何通过迭代提示来读取文本。 论文地址:https://arxiv.org/abs/2310.05029...