-
报道称微软准备推新AI模型,内部代号MAI-1、约5000亿参数
据外媒the Information报道,微软正准备推出一种新的、内部 AI 语言模型。 新模型内部代号为 MAI-1,由最近加入微软的梅斯塔法・苏莱曼负责,他是谷歌 DeepMind 的联合创始人,也是人工智能初创公司 Inflection 的前 CEO...
-
微调大语言模型的七个步骤
译者 | 布加迪 审校 | 重楼 在最近一年半的时间里,自然语言处理(NLP)领域发生了显著的变化,这主要得益于OpenAI的GPT系列等大语言模型(LLM)的兴起。 这些功能强大的模型已彻底改变了我们处理自然语言任务的方法,在翻译、情绪分析和文本自动...
-
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好: 各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住: 甚至是研究人员踢了一脚瑜伽球,机器狗也不会歪倒: 给气球放气机器狗也能保持平衡: 上述展示都是 1 倍速,没有经过...
-
LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向
机器如何能像人类和动物一样高效地学习?机器如何学习世界运作方式并获得常识?机器如何学习推理和规划…… 当一系列问题被提出时,有人回答自回归 LLM 足以胜任。 然而,知名 AI 学者、图灵奖得主 Yann LeCun 并不这么认为,他一直唱衰自回归 LL...
-
苹果iOS 18将迎重磅AI升级!不联网也能分析生成文本
快科技5月6日消息,据媒体报道,随着生成式AI的普及,苹果也开始通过大语言模型(LLM)来改善iPhone现有的默认应用程序。 报道表示,有相关人士分享了苹果内部AI测试环境的一些信息。总体来看,iPhone的几个默认应用将率先获得与AI相关的重大增强,包...
-
ChatGPT们的幕后先驱,斯坦福教授Manning的四十年NLP生涯
今年 1 月份,2024 年度 IEEE 冯诺伊曼奖项结果正式公布,斯坦福大学语言学和计算机科学教授、AI 学者克里斯托弗・曼宁(Christopher Manning)获奖。 曼宁教授是将深度学习应用于 NLP 领域的早期领军人物,在词向量 GloVe...
-
全球开发者用GPT4都在做什么?这28种方法值得一看
出品 | 51CTO技术栈(微信号:blog51cto) 开发者们为OpenAI最新的大型语言模型GPT-4找到了许多不平凡的用途。在最近的Hacker News讨论中,开发者们分享了他们是如何使用这种大型语言模型(LLM)的。我们在此整理了一些最佳建议...
-
OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从一个新颖的3D MLLM架构开始,该架构使用稀疏查询将视觉表示提升和压缩到3D,然后将其输入LLM。 题目:OmniDrive: A Holistic LLM-Agent Framework for...
-
AI日报:Remini“黏土AI”攻占小红书;HeyGen推自动剪辑工具;多图漫画工具StoryDiffusion来了;AI音乐Udio可生成15分钟音频
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、这个五一假期,小红书被Remi...
-
苹果将用自研模型Ajax优化iOS 18 不会推出类ChatGPT聊天机器人
苹果公司正致力于通过其自研的大语言模型Ajax来革新和增强iOS18的用户体验。 Ajax模型于2023年7月首次亮相,它基于Google的Jax机器学习框架构建,并在Google Cloud上运行,展现出了与OpenAI的ChatGPT、微软的Bing、...
-
分享几个.NET开源的AI和LLM相关项目框架
现如今人工智能(AI)技术的发展可谓是如火如荼,它们在各个领域都展现出了巨大的潜力和影响力。今天大姚给大家分享4个.NET开源的AI和LLM相关的项目框架,希望能为大家提供一些参考。 https://github.com/YSGStudyHards/D...
-
库克透露iOS新功能将引入人工智能 或涉及与谷歌和OpenAI的合作
苹果首席执行官蒂姆·库克在最新消息中明确表示,苹果即将推出人工智能功能,而一份来自AppleInsider的新报告揭示了关于下一版iOS可能包含的更多细节。据悉,新功能将主要集中在Siri上,其中包括其具备在消息应用程序中分析和总结文本的能力。 此前的报...
-
低成本LLM应用开发利器——开源FrugalGPT框架
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文将详细介绍一个LLM驱动型应用程序的成本节约架构FrugalGPT。 大型语言模型为计算机科学开辟了一个新的前沿;然而,它们(截至...
-
AI可以改写人类基因组吗?首次由AI从头设计的基因编辑器成功编辑人类细胞中DNA
生成式 AI 可以对话、写诗、画图、做视频、作曲、写代码...... 那么,AI 可以改写人类基因组吗? 现在,新的 AI 技术正在为可编辑 DNA 的微观生物机制绘制蓝图,这预示着未来科学家将以更高的精度和速度对抗疾病。 近日,美国 AI 蛋白质设计初...
-
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。 提高大型语言模型的推理能力是当前研究的最重要方向之一,而在这类任务中,近期发布的很多小模型看起来表现不错,比如微软 Phi-3、Mistral 8x2...
-
斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」
没想到,在大模型时代,知名「AI 教母」李飞飞也要「创业」了,并完成了种子轮融资。 据路透社独家报道,著名计算机科学家李飞飞正在创建一家初创公司。该公司利用类似人类的视觉数据处理方式,使人工智能能够进行高级推理。 知情人士透露称,李飞飞最近为这家公司进行...
-
AI教母李飞飞首次创业!成立“空间智能”公司,已完成种子轮
AI教母李飞飞,创业了! 最新消息,斯坦福大学教授李飞飞正在建立一家AI公司,已完成种子轮融资。 公司方向定为“空间智能”——旨在让AI能像人类一样对视觉信息进行高级推理。消息人士表示,这将是该技术的一次飞跃。 投资方包括硅谷风投a16z和Radical...
-
AI 正在改变编程的教学方式:教授们正从语法转向强调更高层次技能
生成式人工智能正在改变软件开发行业。AI 驱动的编程工具正在协助程序员完成他们的工作流程,同时 AI 领域的工作岗位也在持续增加。但这种转变在学术界也很明显——学术界是下一代软件工程师学习编程的主要途径之一。 计算机科学的学生正在拥抱这项技术,使用生成式...
-
OpenAI 首席执行官 Sam Altman 投资新的以色列人工智能安全初创公司
以色列人工智能安全公司 Apex 宣布已完成 700 万美元的种子轮融资,此轮融资由红杉资本和 Index Ventures 共同领投,多位天使投资者参与,其中包括 OpenAI 首席执行官山姆·阿尔特曼。 自 2022 年 ChatGPT 推出以来,全...
-
OpenAI CEO曾称 GPT-2“非常糟糕”,现在对该版本“情有独钟”
OpenAI 首席执行官 Sam Altman 近日表达了对 GPT-2语言模型的喜爱之情,尽管他此前批评了早期模型,但他对即将推出的 GPT-5充满期待。Altman 在社交平台上承认,他 “确实对 GPT-2有一种软肋”。 今年早些时候,Altman...
-
理解GraphRAG(一):RAG的挑战
检索增强生成(RAG)是一种通过外部知识源增强现有大型语言模型(LLM)的方法,以提供和上下文更相关的答案。在RAG中,检索组件获取额外的信息,使响应基于特定来源,然后将这些信息输入到LLM提示中,以使LLM的响应基于这些信息(增强阶段)。与其他技术(例...
-
MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练
本文分享自华为云社区《MindSpore强化学习:使用PPO配合环境HalfCheetah-v2进行训练》,作者: irrational。 半猎豹(Half Cheetah)是一个基于MuJoCo的强化学习环境,由P. Wawrzyński在“A Cat...
-
AI日报:GPT 2 Chatbot神秘机器人引热议;Kimi上线智能体功能Kimi+;抖音推AI修图产品“星绘”;小红书内测自研大模型“小地瓜”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI神秘搞事,GPT...
-
苹果推出理解、转化模型ReALM,性能超GPT-4
苹果的研究人员推出了一种创新模型ReALM,可将参考解析问题转化为语言建模问题,能极大提升AI助手处理很多描述复杂或模糊不清的内容。 例如,我们网购时选好了橘子、鸭梨、苹果、橘子汽水、洗发水、短袖、拖鞋等物品,然后告诉AI助手只结算水果。这时传统的AI助手...
-
开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型
开源大模型,已经开启大卷特卷模式。 全球范围,太平洋两岸,双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相,国内通义千问就直接开源千亿级参数模型Qwen1.5-110B,一把火上Hacker News榜首。 不仅相较于自家720亿参数模型性能明...
-
LLM和RAG技术的比较探索
作者 | Ashok Gorantla 整理 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能(AI)的动态环境中,两种开创性的技术——大型语言模型(LLM)和检索增强生成(RAG)——在理解和生成类人文本方面脱颖而出。本...
-
还在YOLO-World?DetCLIPv3出手!性能大幅度超出一众SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 现有的开词汇目标检测器通常需要用户预设一组类别,这大大限制了它们的应用场景。在本文中,作者介绍了DetCLIPv3,这是一种高性能检测器,不仅在开词汇目标检测方面表现出色,同时还能为检测到的目标生成...
-
Meta AI 首席科学家:未来 10 年智能手机将过时
据 Meta AI 的首席人工智能科学家 Yann LeCun 透露,未来10至15年内,智能手机将被增强现实眼镜和手环所取代。LeCun 表示:“我们最后可能需要的是智能虚拟助手,帮助我们在日常生活中。因此,今天我们都在口袋里携带着智能手机,但10年或1...
-
巨人网络发布2023年报:称将持续研究GiantGPT应用场景
4月29日,巨人网络发布2023年年度报告及2024年一季度报告。 报告显示,2023年公司实现营业收入29.24亿元,同比增长43.50%,实现归属于上市公司股东的净利润10.86亿元,同比增长27.67%;实现归属于上市公司股东的扣除非经常性损益的净利...
-
奥地利隐私投诉瞄准 OpenAI 的 ChatGPT
微软支持的初创公司 OpenAI 在周一成为了奥地利维权团体 NOYB 的投诉对象,指控其生成式 AI 聊天机器人 ChatGPT 提供了不准确的信息,可能违反欧盟隐私规定。 图源备注:图片由AI生成,图片授权服务商Midjourney NOYB 表示,...
-
CharacterAI平替?Anime gf :一个本地且开源的“动漫女友”平台
Anime gf 是一个本地开源工具,为用户提供了与虚拟角色互动的平台,类似于 CharacterAI。Anime gf 提供了一个用户友好的界面,允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色,让每个虚拟角色都有自己的独特个性和语言风格。支持通...
-
“地表最强”文生视频模型?Sora 背后有何秘密?
自 2022 年底 ChatGPT 的横空出世,人工智能再度成为全世界的焦点,基于大语言模型(LLM)的 AI 更是人工智能领域的“当红炸子鸡”。此后的一年,我们见证了 AI 在文生文、文生图领域的飞速进展,但在文生视频领域发展相对较慢。而在 2024 年...
-
小红书从记忆机制解读信息检索,提出新范式获得 EACL Oral
近日,来自小红书搜索算法团队的论文《Generative Dense Retrieval: Memory Can Be a Burden》被自然语言处理领域国际会议 EACL 2024 接收为 Oral,接受率为 11.32%(144/1271)。 他...
-
AI日报:当前最强国产Sora大模型Vidu发布;Kimi Chat移动端升级;通义千问开源首个千亿参数模型;苹果计划与 OpenAI 合作
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、清华团队发布视频大模型Vidu...
-
半年涨粉1000万,这个AI聊天搭子是怎么火的
最近,很多快手用户都能发现,一个名叫「AI小快」的账号格外活跃。 在视频作品的评论区,经常有人跟「AI小快」聊得火热,一个抛梗、一个接梗: 如果你问点严肃问题,AI小快一样有问必答: 没看明白的视频,还能帮忙解读: 甚至还有离谱之中带有一丝合理的扩...
-
大语言模型对汽车行业的影响和实践探索
汽车行业作为技术创新的重要领域,正迅速采纳大语言模型,如 GPT 系列,以推动行业的数字化转型。这些模型在提升车载智能系统的交互体验、优化客户服务、加速产品开发及市场营销策略方面展现出巨大潜力。通过具体应用案例分析,接下来我们一起揭示大语言模型如何为汽...
-
Perplexica:开源AI驱动的问答搜索引擎
Perplexica是一个开源的AI驱动搜索引擎,提供多种搜索模式,旨在为用户提供更精准、更智能的搜索体验。它受到Perplexity AI的启发,不仅能够搜索网络,还能理解并回答用户的问题。 Perplexica的核心功能包括: 本地大型语言模型(LL...
-
终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代
【新智元导读】Sora一出,谁与争锋!近日,Sora团队的三位负责人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采访,解读了Sora在模拟现实、预测结果和丰富人类体验等方面带来的变革。 对于视频生成领域,大家一致的看法就...
-
苹果OpenAI合作,力争今年生成式AI登陆iPhone
OpenAI,Google,Anthropic 齐聚 Apple 下一代操作系统,WWDC24 上,iOS 的这块蛋糕究竟花落谁家? 苹果在各国市场的 AI 领域,一直在业内寻求可靠并值得信赖的合作伙伴,以助于将各类生成式 AI 技术应用于 iPhone...
-
AI入侵播客圈!比真人配音还逼真?实测爆火的微软AI语音角色“晓晓”
AI语音再进化,人耳还能听出AI和真人的差别吗? 以上两段音频demo来自微软最近更新的AI语音角色“晓晓”。逼真、情绪到位、语气自然、断句近乎完美,是绝大多数网友听到“晓晓”声音时给出的评价。 在播客App小宇宙上,“Hacker News”账号用“晓...
-
ChatGPT可以开车吗?分享大型语言模型在自动驾驶方面的应用案例
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 人工智能技术如今正在快速发展和应用,人工智能模型也是如此。拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型...
-
Docker三分钟搞定LLama3开源大模型本地部署
概述 LLaMA-3(Large Language Model Meta AI 3)是由Meta公司开发的大型开源生成式人工智能模型。它在模型结构上与前一代LLaMA-2相比没有大的变动。 LLaMA-3模型分为不同规模的版本,包括小型、中型和大型,以适...
-
量化、剪枝、蒸馏,这些大模型黑话到底说了些啥?
量化、剪枝、蒸馏,如果你经常关注大语言模型,一定会看到这几个词,单看这几个字,我们很难理解它们都干了些什么,但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们,理解其中的原理。 模型压缩 量化、剪枝、蒸馏,其实是通用的神经网络...
-
革新LLM微调之道:全方位解读PyTorch原生库torchtune的创新力量与应用价值
在人工智能领域,大语言模型(LLMs)正日益成为研究和应用的新热点。然而,如何高效、精准地对这些庞然大物进行调优,一直是业界和学术界面临的重要挑战。近期,PyTorch官方博客发布了一篇关于TorchTune的文章,引起了广泛关注。TorchTune作为...
-
OpenAI Preparedness团队首席Aleksander Madry:机器学习模型的内部计算如何将输入转化为预测?
考虑一个标准的ResNet50模型,该模型经过训练用于图像分类任务。我们是否能够理解这个模型中的卷积滤波器如何将输入图像转换为其预测的标签?或者,GPT-3中的注意力头如何contribute到下一个标记的预测?理解这些模型组件——包括滤波器或头等架构...
-
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
近日,颜水成教授团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。 项...
-
昆仑万维,闯入AI“决赛”
从电子计算机诞生前,符号主义学派与连接主义学派的斗争,到后来深度学习的兴起,再到如今AIGC领域的爆发,AI从理论到实践的跨越过程,亦悄然改写了人类的历史进程。 当下,随着一众科技公司竞相拥抱AIGC浪潮,将AI战略常态化,AIGC赛道的中场战事已然打响—...
-
AI信任危机之后,揭秘预训练如何塑造机器的「可信灵魂」
图表 1: 大模型的通用训练流程 [1] 在人工智能的前沿领域,大语言模型(Large Language Models,LLMs)由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中,预训练阶段占据着举足轻重的地位,它不仅消耗了大量的计...
-
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是...
-
一文读懂 LLM 的构建模块:向量、令牌和嵌入
在当今信息爆炸的时代,我们不断面临着海量文本数据的挑战。为了有效地处理和理解这些数据,自然语言处理(NLP)领域的研究者们一直在不断探索和创新。而其中一个重要的研究方向就是语言模型(Language Model)。 在这篇文章中,我们将一起探索和理解...