-
Ollama如何构建自己的Llama3中文模型
Ollama Ollama 是一个开源的大型语言模型(LLM)服务工具,它允许用户在本地机器上运行和部署大型语言模型。Ollama 设计为一个框架,旨在简化在 Docker 容器中部署和管理大型语言模型的过程,使得这一过程变得简单快捷。用户可以通过简单的...
-
思维链被推翻!纽约大学新研究:大模型推理步骤或可省略
纽约大学的最新研究对当前流行的思维链(Chain-of-Thought,CoT)技术提出了挑战,该技术原本被认为能够提升大模型的推理能力。研究显示,使用省略号代替具体的推理步骤,模型的推理结果并没有显著差异,这意味着增加计算量而非推理步骤本身可能是提升性能...
-
Android即将推出基于AI的诈骗电话检测功能
在 Google 的 I/O 开发者大会上,Google 宣布正在测试一项新的通话监测功能,以提醒用户正在与可能试图欺诈他们的人进行通话,并鼓励他们结束此通话。Google 表示,该功能利用了 Gemini Nano 技术,这是公司为 Android 设备...
-
突发!OpenAI首席科学家Ilya官宣离职,GPT-4负责人接任
今天,OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推宣告离职。 在 OpenAI 工作近 10 年后,我做出了离开的决定。OpenAI 的发展轨迹可以称得上是奇迹,我相信 OpenAI 会在 Sam Altman、G...
-
OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版
IT之家 5 月 14 日消息,OpenAI 终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Wind...
-
企业拒绝ChatGPT的五大原因
ChatGPT让人们兴奋不已,为什么苹果、亚马逊、摩根大通、德意志银行、三星和埃森哲等这么多企业都禁止使用它呢?主要是由于担心部署像ChatGPT这样的外部大型语言模型(LLM ,可能导致敏感数据被传输和存储在企业安全环境之外。 生成式人工智能(Gen...
-
分析师警告,AI 热潮将导致高端内存芯片供应紧张
根据分析师的预测,由于爆炸性的人工智能需求推动了高端内存芯片的短缺,高性能内存芯片在今年很可能仍然供不应求。全球两大内存芯片供应商 SK Hynix 和 Micron 表示,他们的高带宽内存芯片已经售罄,2025年的库存也几乎售罄。晨星的股权研究主管 Ka...
-
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...
-
看红帽如何在RHEL与OpenShift中玩转生成式AI
市场上有很多生成式AI平台的选择,为什么要选择红帽? 红帽总裁兼CEO Matt Hicks直言红帽的不同之处在于运行位置的核心灵活性。企业既可以对小型开源模型进行混合部署,也可以在公有云或自有数据中心训练模型,同时支持主要的GPU供应商。 最近在R...
-
Fine-Tuning Vs RAG ,该如何选择?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 构建块:向量、令牌和嵌入 。 随着技术的不断进步,LLM 带来了前所未有的机遇,吸引了开发者和组织纷纷尝试利用其强大的能力构建应用程序。然而,当预训...
-
Siri Ultra:快捷命令激活iPhone上的大模型进行对话与搜索
Siri Ultra是一款由大型语言模型(LLMs)支持的智能助手,它能够与iPhone上的快捷命令集成,实现包括Llama3、GPT等模型在内的对话功能。用户现在可以享受实时语音交互和联网搜索的便利。 Siri Ultra利用Cloudflare Wo...
-
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?
2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)已经在文本和图像等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。 然而,对于这些模型的评测多集中于语言上的任务,...
-
AI游戏“换你来当爹”在哪玩 “换你来当爹”网页入口地址
在人工智能技术的推动下,游戏行业正在经历一场革命。最近,一款名为《换你来当爹》的AI游戏引起了广泛关注。这款游戏利用了最新的大型语言模型(LLM)技术,通过AI实时生成剧情和对应图片,为玩家提供了一种全新的游戏体...
-
扩散模型与文生视频
一、快速发展的文生视频 在当前的人工智能领域,文生视频技术有着引人注目的进展。该技术的核心任务非常明确,就是利用文本指令来控制视频内容的生成。具体而言,用户可以输入特定文本,系统则根据这段文本生成相应的视觉画面。这一过程并不局限于单一的输出,相同的文本可...
-
LLM 评估新纪元:Arthur Bench 全方位解读
一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一些方法,例如基于“单词出现”的评估方法,比如 BLEU,以及基于“预训练的自然语言处理模型”...
-
研究称 AI、ChatGPT 和社交媒体可能加剧气候危机
一项发表在《全球环境政治》期刊上的论坛文章指出,生成式人工智能(AI)包括像 OpenAI 的 ChatGPT 这样的大型语言模型,以及社交体可能会削弱应对气候变化的努力。 来自英属哥伦比亚大学(UBC)的研究人员出,人们普遍认为 AI、社交媒体和其他技术...
-
法国AI初创公司 Mistral AI 估值 60 亿美元
法国初创公司 Mistral 致力于开源大型语言模型的研发,已在本轮融资中估值达到60亿美元,这一消息吸了投资界的广泛关注。据悉,DST、General Catalyst 和 Lightspeed Venture Partners 等投资机构均有意参与本轮...
-
AI游戏《换你来当爹》上线 结果,我把逆子室友养废了...
在人工智能技术的推动下,游戏行业正经历着一场革命。最近,一款名为《换你来当爹》的AI游戏引起了广泛关注。这款游戏利用了最新的LLM(大型语言模型)技术,通过AI实时生成剧情和对应图片,为玩家提供了一种全新的游戏体验。 《换你来当爹》的核心魅力在于其高度的...
-
DriveWorld:一个预训练模型大幅提升检测+地图+跟踪+运动预测+Occ多个任务性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 以视觉为中心的自动驾驶技术近期因其较低的成本而引起了广泛关注,而预训练对于提取通用表示至关重要。然而,当前的以视觉为中心的预训练通常依赖于2D或3D预训练任务,忽视了自动驾驶作为4D场景理解...
-
研究发现 AI 生成的同情心存在局限性
人工智能生成的对话代理(CAs)如 Alexa 和 Siri 旨在回答问题、提供建议,甚至展现同情心。然而,最新研究发现,在解释和探索用户体验方面,它们与人类相比表现不佳。 CAs 由大型语言模型(LLMs)驱动,这些模型摄入大量人类产生的数据,因此可能存...
-
红帽发布 RHEL AI,助力企业开发、运行开源生成式AI模型
红帽在最近举办的峰会上宣布推出了 Red Hat Enterprise Linux AI(RHEL AI)开发者预览版。 该产品被定位为基础模型平台,用于无缝开发、测试和运行同类最佳的开源 Granite 生成式人工智能模型,为企业应用提供动力。RHEL...
-
据报道,微软正在开发拥有5000亿个参数的MAI-1人工智能模型
据The Information近日报道,微软公司正在开发一个拥有约5000亿个参数的大型语言模型。 据悉,这个在微软内部被称为MAI-1的大型语言模型预计最早将于本月亮相。 OpenAI在2020年中期推出 GPT-3 时,详细说明了该模型的初始版...
-
Agent Hospital:一个先进的虚拟AI医院模拟平台
Agent Hospital是一个创新的虚拟AI医院平台,它通过模拟医院中的所有真实医疗流程,为医疗教育和临床决策提供了一个高效的训练和研究环境。该平台涵盖了从疾病发生到治疗与康复的整个医疗过程,包括分诊、挂号、咨询、检查、诊断、治疗和随访等关键环节。...
-
7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名
ICLR 全称为国际学习表征会议(International Conference on Learning Representations),今年举办的是第十二届,于 5 月 7 日至 11 日在奥地利维也纳展览会议中心举办。 在机器学习社区中,ICLR...
-
斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用
全球首个超小型多模态AI Agent模型Octopus V3,来自斯坦福大学的NEXA AI团队,让Agent更加智能、快速、能耗及成本降低。 今年四月份初,NEXA AI推出了备受瞩目的Octopus V2,该模型在函数调用性能上超越了GPT-4,减...
-
快3倍!Meta 违背经典模型结构,一次预测多个token,路径可行,大模型大幅提速指日可待!
编译|伊风 出品 | 51CTO技术栈(微信号:blog51cto) 众所周知,LLMs的工作原理是对下一个token进行预测。 读者朋友们有没有曾这样想过:如果LLM一次预测n个token呢?那是不是就快n倍?Meta也是这样想的!并且付诸实践。 在最...
-
Meta 发布新多token预测技术,使AI模型速度提升3倍
近期,Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的研究人员在一项研究中提出了一种改进 AI 大型语言模型(LLMs)准确性和速度的方法,即通过同时预测多个token。这与自回归语言模型...
-
为什么LLM在人工智能中如此受欢迎?
将大型语言模型(LLM 提升到人工智能(AI 同义词世界的中心是一项巨大的任务,它改变了描述自然语言处理(NLP 的方式。这些高度复杂的模型将其翻译成英语,使我们能够理解和生成质量可接受的文本,这是由于使用了大量数据集,并在使用的变压器网络架构等人工神...
-
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好: 各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住: 甚至是研究人员踢了一脚瑜伽球,机器狗也不会歪倒: 给气球放气机器狗也能保持平衡: 上述展示都是 1 倍速,没有经过...
-
全球开发者用GPT4都在做什么?这28种方法值得一看
出品 | 51CTO技术栈(微信号:blog51cto) 开发者们为OpenAI最新的大型语言模型GPT-4找到了许多不平凡的用途。在最近的Hacker News讨论中,开发者们分享了他们是如何使用这种大型语言模型(LLM)的。我们在此整理了一些最佳建议...
-
分享几个.NET开源的AI和LLM相关项目框架
现如今人工智能(AI)技术的发展可谓是如火如荼,它们在各个领域都展现出了巨大的潜力和影响力。今天大姚给大家分享4个.NET开源的AI和LLM相关的项目框架,希望能为大家提供一些参考。 https://github.com/YSGStudyHards/D...
-
库克透露iOS新功能将引入人工智能 或涉及与谷歌和OpenAI的合作
苹果首席执行官蒂姆·库克在最新消息中明确表示,苹果即将推出人工智能功能,而一份来自AppleInsider的新报告揭示了关于下一版iOS可能包含的更多细节。据悉,新功能将主要集中在Siri上,其中包括其具备在消息应用程序中分析和总结文本的能力。 此前的报...
-
低成本LLM应用开发利器——开源FrugalGPT框架
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文将详细介绍一个LLM驱动型应用程序的成本节约架构FrugalGPT。 大型语言模型为计算机科学开辟了一个新的前沿;然而,它们(截至...
-
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。 提高大型语言模型的推理能力是当前研究的最重要方向之一,而在这类任务中,近期发布的很多小模型看起来表现不错,比如微软 Phi-3、Mistral 8x2...
-
AI 正在改变编程的教学方式:教授们正从语法转向强调更高层次技能
生成式人工智能正在改变软件开发行业。AI 驱动的编程工具正在协助程序员完成他们的工作流程,同时 AI 领域的工作岗位也在持续增加。但这种转变在学术界也很明显——学术界是下一代软件工程师学习编程的主要途径之一。 计算机科学的学生正在拥抱这项技术,使用生成式...
-
OpenAI 首席执行官 Sam Altman 投资新的以色列人工智能安全初创公司
以色列人工智能安全公司 Apex 宣布已完成 700 万美元的种子轮融资,此轮融资由红杉资本和 Index Ventures 共同领投,多位天使投资者参与,其中包括 OpenAI 首席执行官山姆·阿尔特曼。 自 2022 年 ChatGPT 推出以来,全...
-
理解GraphRAG(一):RAG的挑战
检索增强生成(RAG)是一种通过外部知识源增强现有大型语言模型(LLM)的方法,以提供和上下文更相关的答案。在RAG中,检索组件获取额外的信息,使响应基于特定来源,然后将这些信息输入到LLM提示中,以使LLM的响应基于这些信息(增强阶段)。与其他技术(例...
-
LLM和RAG技术的比较探索
作者 | Ashok Gorantla 整理 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能(AI)的动态环境中,两种开创性的技术——大型语言模型(LLM)和检索增强生成(RAG)——在理解和生成类人文本方面脱颖而出。本...
-
Meta AI 首席科学家:未来 10 年智能手机将过时
据 Meta AI 的首席人工智能科学家 Yann LeCun 透露,未来10至15年内,智能手机将被增强现实眼镜和手环所取代。LeCun 表示:“我们最后可能需要的是智能虚拟助手,帮助我们在日常生活中。因此,今天我们都在口袋里携带着智能手机,但10年或1...
-
奥地利隐私投诉瞄准 OpenAI 的 ChatGPT
微软支持的初创公司 OpenAI 在周一成为了奥地利维权团体 NOYB 的投诉对象,指控其生成式 AI 聊天机器人 ChatGPT 提供了不准确的信息,可能违反欧盟隐私规定。 图源备注:图片由AI生成,图片授权服务商Midjourney NOYB 表示,...
-
CharacterAI平替?Anime gf :一个本地且开源的“动漫女友”平台
Anime gf 是一个本地开源工具,为用户提供了与虚拟角色互动的平台,类似于 CharacterAI。Anime gf 提供了一个用户友好的界面,允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色,让每个虚拟角色都有自己的独特个性和语言风格。支持通...
-
苹果计划与 OpenAI 合作,加强 iPhone 人工智能功能
据报道,苹果正与 OpenAI 合作,旨在为 iPhone 开发生成式人工智能产品,以提升其人工智能功能。苹果近年来在人工智能领域的野心似乎有所减退。原本苹果封闭式的人工智能开发曾让人们猜测其或许掌握了一些神秘的技巧,但到了2024年,公司的旗舰产品 iP...
-
大语言模型对汽车行业的影响和实践探索
汽车行业作为技术创新的重要领域,正迅速采纳大语言模型,如 GPT 系列,以推动行业的数字化转型。这些模型在提升车载智能系统的交互体验、优化客户服务、加速产品开发及市场营销策略方面展现出巨大潜力。通过具体应用案例分析,接下来我们一起揭示大语言模型如何为汽...
-
Perplexica:开源AI驱动的问答搜索引擎
Perplexica是一个开源的AI驱动搜索引擎,提供多种搜索模式,旨在为用户提供更精准、更智能的搜索体验。它受到Perplexity AI的启发,不仅能够搜索网络,还能理解并回答用户的问题。 Perplexica的核心功能包括: 本地大型语言模型(LL...
-
ChatGPT可以开车吗?分享大型语言模型在自动驾驶方面的应用案例
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 人工智能技术如今正在快速发展和应用,人工智能模型也是如此。拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型...
-
Docker三分钟搞定LLama3开源大模型本地部署
概述 LLaMA-3(Large Language Model Meta AI 3)是由Meta公司开发的大型开源生成式人工智能模型。它在模型结构上与前一代LLaMA-2相比没有大的变动。 LLaMA-3模型分为不同规模的版本,包括小型、中型和大型,以适...
-
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是...
-
研究显示,GPT-4可以自主利用安全漏洞,具备攻击性
每周至少有一次,生成式人工智能都会给我们带来新的恐惧。虽然我们仍在焦急地等待 OpenAI 发布的下一个大型语言模型,但与此同时,GPT-4似乎比你想象的更具备能力。最近的一项研究表明,研究人员展示了 GPT-4可以在没有人类干预的情况下利用网络安全漏洞。...
-
云端部署大模型的三个秘密
编译 | 星璇 出品 | 51CTO技术栈(微信号:blog51cto) 在过去的两年里,我更多地参与了使用大型语言模型(LLMs)的生成式AI项目,而非传统的系统。我开始怀念无服务器云计算。它们的应用范围广泛,从增强对话式AI到为各行各业提供复杂的分...
-
2024年8个AI商业趋势 最先进的AI模型变得越来越昂贵
斯坦福大学人类中心人工智能研究所发布的2024年人工智能指数,报告揭示了人工智能在商业领域的八大趋势,涵盖了人类优势、成本、监管、投资增长、工作效率提升等方面的关键问题,为企业和决策者提供了重要的参考和启示。 1. 人类在许多任务上仍然优于人工智能 研究表...