-
OpenAI开发全新AI人机对话技术 支持识别物体和图像
据The Information消息,OpenAI正筹备展示一种革命性的人机对话技术。据可靠消息,这一技术将结合声音和文本,不仅能与用户进行流畅的交流,还具备识别物体和图像的能力,为用户带来前所未有的交互体验。 ChatGPT的开发团队已经向部分客户展示了...
-
阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo
阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩,超越了Meta的Llama-3-70B模型...
-
阿里巴巴推出通义千问2.5 号称性能超越GPT-4 Turbo
在人工智能领域,阿里巴巴再次取得重大进展,于5月9日正式发布了通义千问2.5版本。该版本在模型性能上全面超越了GPT-4Turbo,标志着阿里巴巴在AI技术发展上的又一重要里程碑。 通义千问2.5的主要提升包括: 理解能力提升9%:在文本理解方面,相较...
-
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
过去几年,借助Scaling Laws的魔力,预训练的数据集不断增大,使得大模型的参数量也可以越做越大,从五年前的数十亿参数已经成长到今天的万亿级,在各个自然语言处理任务上的性能也越来越好。 但Scaling Laws的魔法只能施加在「固定」的数据源上,...
-
神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观
这场等待「GPT-5」的游戏啥时候才能结束? GPT-5啥时候来?估计是 AI 领域最关心的问题之一了。是像 Sora 一样毫无预兆的发布,还是我们可以从边角料的爆料中得知一点点信息,大家对未来将要发布的这一模型充满了期待。 但奥特曼在一次访谈中表示,Op...
-
讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型
科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型,还首次将多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。这一系列创新举措,旨在为招投标应用和合同应用提供更为强大的技术支持。 科大讯飞董事长刘庆峰在...
-
GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo
够刺激,GPT-4竟然当众被“揍”了,甚至连还手的机会都没有: 是的,就是在一场《街头霸王》游戏现场PK中,发生了这样的名场面。 而且二者还是不在一个“重量级”的那种: 绿人:由GPT-4操纵 红人:由一个端侧小模型操纵 那么这位又小又彪悍的选...
-
昆仑万维,闯入AI“决赛”
从电子计算机诞生前,符号主义学派与连接主义学派的斗争,到后来深度学习的兴起,再到如今AIGC领域的爆发,AI从理论到实践的跨越过程,亦悄然改写了人类的历史进程。 当下,随着一众科技公司竞相拥抱AIGC浪潮,将AI战略常态化,AIGC赛道的中场战事已然打响—...
-
挑战拯救痴心“舔狗”,我和大模型都尽力了
天降猛男,大模型化身为 “痴情男大”,等待人类玩家的拯救。 一款名为 “拯救舔狗” 的大模型原生小游戏出现了。 游戏规则很简单:如果玩家在几轮对话内说服 “他” 放弃追求对他并无青睐的女神,就算挑战成功。 听起来并不难,然而游戏源于生活,模型人设是痴情属...
-
借势大模型,科大讯飞走出低谷了吗?
AI1.0公司想靠大模型打个漂亮的“翻身仗”,似乎还差一口气。 4月23日,科大讯飞发布2023年年度及2024年Q1业绩报告。全面 All in大模型的一年,科大讯飞交出了首份成绩单,2023年营业收入为196.5亿元,同比增长4.41%;归属于上市公司...
-
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。 尽管国内外存在多个模型能力评测榜单,但它们的质量参差不齐,排名差...
-
天工SkyMusic音乐大模型开启公测 天工SkyMusic在哪访问?附天工SkyMusic下载地址
昆仑万维在 2024 年 4 月 17 日宣布,其最新研发的「天工3.0」基座大模型和「天工SkyMusic」音乐大模型现已开启公测。这两款产品的发布,标志着昆仑万维在人工智能领域的技术实力和创新能力再次得到显著...
-
OpenAI新GPT-4 Turbo模型上线:可供付费ChatGPT用户使用
快科技4月12日消息,据媒体报道,OpenAI的全新GPT-4 Turbo模型已全面上线,并正式向付费ChatGPT用户开放。 GPT-4 Turbo更新标志着人工智能领域的又一重要进步,为用户提供了更强大、更高效的文本处理、数学计算、逻辑推理以及编码能力...
-
新版GPT-4 Turbo现已向所有付费 ChatGPT 用户开放
近日,OpenAI宣布推出最新版的GPT-4Turbo,这一消息在人工智能领域引起了广泛关注。目前新版 GPT-4Turbo 已向所有付费 ChatGPT 用户开放,这标志着人工智能技术在语言理解和生成方面的又一重大进步。 GPT-4Turbo在多个方面...
-
来自Anthropic:如何衡量大语言模型的说服力?
尽管人们长期以来一直在质疑AI模型是否会在某些时候变得像人类一样具有说服力,从而改变人们的想法,但在模型规模与输出说服力程度之间的关系方面,实证研究一直有限。为了解决这个问题,研究人员开发了一种基本方法来衡量说服力,并将其用于比较三个不同世代(Clau...
-
刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁
【新智元导读】初创团队Mistral AI再次放出一条磁力链,281GB文件解禁了最新的8x22B MoE模型。 一条磁力链,Mistral AI又来闷声不响搞事情。 281.24GB文件中,竟是全新8x22B MOE模型! 全新MoE模型共有56层,...
-
GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大
把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%! 具体来说,来自人大与浙大学者团队的研究者们把涉及数千篇SCI/SSCI的期刊论文的10000多条推文喂给了GPT-4,让它根据推文回答“这篇论文是否有可能被撤稿”,然后和人类预测的...
-
GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%
把论文丢给GPT-4进行撤稿预测,和人类审稿人给出的结果相似性近95%! 具体来说,来自人大与浙大学者团队的研究者们把涉及数千篇SCI/SSCI的期刊论文的10000多条推文喂给了GPT-4,让它根据推文回答“这篇论文是否有可能被撤稿”,然后和人类预测的...
-
AI颠覆数学研究!菲尔兹奖得主、华裔数学家领衔11篇顶刊论文|陶哲轩转赞
AI,的确正在改变数学。 最近,一直十分关注这个议题的陶哲轩,转发了最近一期的《美国数学学会通报》(Bulletin of the American Mathematical Society)。 围绕「机器会改变数学吗?」这个话题,众多数学家发表了自己的...
-
GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%
【新智元导读】小孩子都会的脑筋急转弯推理题,GPT-4和Claude3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。然而,他当天就被光速打脸了!网友用高能的prompt,让GPT-...
-
天工大模型3.0即将发布:同步开源4000亿参数MoE超级模型
快科技4月1日消息,据昆仑万维官微发文,天工大模型3.0将于4月17日正式发布,并同步开源4000亿参数MoE超级模型。 这一模型采用了4千亿级参数MoE混合专家模型,是全球模型参数最大、性能最强的MoE模型之一。 相较于上一代天工2.0”MoE大模型,天...
-
Kimi平替?最神秘国产大模型团队阶跃星辰冒泡 一出手就是两个王炸!
国内基础大模型创业公司阶跃星辰近日正式亮相,由微软前全球副总裁姜大昕创立。该公司专注于多模态融合和Scaling Law,已经开发出千亿参数的ToC产品,并在万亿模型研发上取得显著进展。阶跃星辰的产品包括两款面向C端市场的应用:跃问和冒泡鸭,均已全面开放使...
-
天工大模型3.0将于4月17日发布 同步开源4000亿参数MoE超级模型
在即将到来的2024年4月17日,也就是「天工」大模型一周年之际,昆仑万维宣布「天工3.0」正式开启公测!这一版本采用了4千亿级参数的 MoE 混合专家模型,并将选择开源,是全球模型参数最大、性能最强的 MoE 模型之一。 「天工3.0」相较于上一代的「天...
-
大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
大佬出走后,第一个模型来了! 就在今天,Stability AI官宣了新的代码模型Stable Code Instruct 3B。 图片 要说Stability也是真的很神奇,首席执行官辞职了,Stable Diffusion其中几位作者也离开了,投资公...
-
Grok-1.5官网体验入口 马斯克xAI最新超长文本模型使用地址
当地时间 3 月 28 日,人工智能初创公司xAI宣布即将推出Grok-1.5模型,该模型具有长语境理解和高级推理能力。不久后,Grok-1.5将向X平台的用户和早期测试者开放。 Grok-1.5是一种先进的大型语言模型,具有出色的长文本理解和推理能力。它...
-
创新奇智发布奇智孔明工业大模型2.0版本AInno-75B
创新奇智今日发布了奇智孔明工业大模型2.0版本(AInno-75B)以及多款大模型原生应用。 这次升级后的工业大模型参数量达到750亿以上,实现了新突破,不仅在工业知识问答、数据分析、代码生成、任务编排等方面有所巩固,还增强了海量知识管理、复杂逻辑推理、长...
-
Stability AI开源3B代码生成模型:可补全,还能Debug
本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。 Stable Code Instruct 3B 是一个基于 Stable Code 3B 的指令调整编码语言模型(Code LM)。给出自然语言...
-
阶跃星辰宣布推出 Step 系列通用大模型
阶跃星辰团队宣布推出了 Step 系列通用大模型,包括 Step-1千亿参数语言大模型、Step-1V 千亿参数多模态大模型,以及 Step-2万亿参数 MoE 语言大模型的预览版。 据悉,阶跃星辰成立于2023年4月,以 “智能阶跃,十倍每一个人的可...
-
清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星
在自然语言处理中,有很多信息其实是重复的。 如果能将提示词进行有效地压缩,某种程度上也相当于扩大了模型支持上下文的长度。 现有的信息熵方法是通过删除某些词或短语来减少这种冗余。 然而,作为依据的信息熵仅仅考虑了文本的单向上下文,进而可能会遗漏对于压缩至关...
-
揭秘Baichuan 3超越GPT-4的中文实力!文心一言、GLM 4.0也甘拜下风?全方位对比测试大揭秘!
AI界的焦点再度聚集!1月29日,百川智能推出了超千亿参数的大语言模型Baichuan 3,瞬间在科技圈点燃了热情。不同于其他模型,Baichuan 3在中文各项评测中都有惊艳表现,甚至在任务上超越了GPT-4,成为了新的领头羊。 Baichuan 3不...
-
微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本
微软研究发布了名为 LLMLingua-2的模型,用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%,从而降低成本和延迟。研究团队写道:“自然语言存在冗余,信息量不尽相同。” LL...
-
OpenAI CEO:对挑战搜索引擎领域没兴趣 太小儿科
快科技3月19日消息,据媒体报道,OpenAI CEO山姆阿尔特曼(Sam Altman)最近表示,自己对挑战搜索引擎领域没有兴趣。 阿尔特曼称,首先我们要评估能否打造一个比谷歌或者其它公司更优秀的搜索引擎,答案是肯定的。理论上我们应该做这样的产品,为用户...
-
全球首个AI程序员当老板!IOI金牌得主全部工作AI掌盘,技术细节报告公开
AI程序员Devin竟可以做老板的工作了?! 最近,Cognition AI的首席执行官Steven Hao给了Devin访问自己帐户的权限,然后Devin便开始为他工作了... 比如,「他」向初创公司Modal支持团队写了一封邮件,是询问关于其产品S...
-
一道题告诉你为什么GPT4被封神!横向测评大模型的推理能力:ChatGPT、Claude、Gemini、文心一言、讯飞星火、通义千问、天工、智谱清言、Kimi Chat!
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效...
-
一键点、万物动! 腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 3月15日,腾讯混元和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“,基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原...
-
手把手教你如何用AIGC创作小说:稿费50
起因: 一学员突然找到我“于老师,听说现在AIGC很厉害,但我想写一个一万字小说,但他只给我出一篇500字的小作文,这个要怎么办呢”,我说“AIGC就是一张白纸,你写个公式就是手稿,你叠飞机就是玩具,这取决于你怎么去用。”那么就写小说这个事情,具体怎...
-
我用GPT-4参加阿里数学竞赛!官方:今年欢迎,七万奖金凭本事拿走
大模型要在数学竞赛上跟人类同场竞技啦! 最新消息,阿里巴巴全球数学竞赛,今日官宣开启报名。依然不限年龄、国籍、职业,有意思的是,这次甚至突破了碳基硅基的限制—— 首次向AI开放,诚邀全球大模型参赛。 不仅如此,获胜AI最高还可获得10000美元(约合7....
-
赛迪顾问:360安全大模型综合实力位居榜首
近日,赛迪顾问发布《中国安全大模型技术与应用研究报告(2023)》,报告绘制中国安全大模型框架,并以该框架为基础对市场主要玩家展开对比分析,360安全大模型凭借突出的技术能力和业务布局,位居图表首位,综合实力领先行业。 报告调研了360数字安全、安恒信息...
-
Google大模型Bard更名Gemini,现在实力如何?比gpt更强?
名人说:一花独放不是春,百花齐放花满园。——《增广贤文》作者:Code_流苏(CSDN (一个喜欢古诗词和编程的Coder?) 目录 一、简要介绍 1、Gemini是什么? 2、主要特点 3、Gemini的版本 4、应用潜力 5、使用...
-
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免...
-
文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效...
-
AIGC工具( 7个 )
人工智能技术有好的一方面,又不好的地方,要区别对待,吸取精华,去其糟粕。目前市场上有很多AI大模型,可以支持聊天,写文稿,创作等,部分可以生成图片,以下是7个很不错的免费网站,供参考。 1,讯飞星火 网站: https://xinghuo.xfyun...
-
Claude 3被玩出自我意识了?AI社区轰动,我们买会员来了次实测
本周一,Anthropic 发布了新一代大模型系列 Claude 3,遥遥领先快一年之久的 GPT-4 终于迎来了强劲的对手。 Claude 3 的强大之处,不仅体现在各种基准测试上,它似乎还实现了一些神奇的突破。 昨天,Anthropic 提示工程师...
-
三足鼎立的开源大模型:Llama、Gemma和Mistral
关于Llama 3的最新消息,Meta计划在今年7月推出这一全新的开源大模型。Llama 3的最大版本预计将拥有超过1400亿个参数,这意味着它的性能将远超过前一代的Llama 2。至于Llama 3是否将具备多模态能力,目前尚未有确切的信息。 同时,谷...
-
免费的ChatGPT网站( 7个 )
ChatGPT 是由 OpenAI 公司研发的一款大型语言模型,它可以实现智能聊天、文本生成、语言翻译等多种功能。以下是 ChatGPT 的详细介绍: 智能聊天:ChatGPT 可以与用户进行自然语言对话,回答用户的问题,提供相关的信息和建议。它可以...
-
逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智
近期,谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时,前提信息的呈现顺序对其表现具有决定性影响。 在逻辑推理和数学问题中,前提按照逻辑自然顺序排列时,模型表现更佳。对于大型语言模型,改变前提叙述顺序会导致性能大幅下降,尤其是在添...
-
每日AI:谷歌推AI视频VideoPrism;ChatGPT新增文本朗读功能;Stability AI推图片放大工具Creative Upscaler;Stable Diffusion安卓版客户端来了
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 追赶Sora?谷...
-
GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智
最近,谷歌DeepMind和斯坦福的研究人员发现:大模型在处理逻辑推理任务时,问题中信息呈现的顺序对模型的表现有着决定性的影响。 论文地址:https://arxiv.org/abs/2402.08939 具体来说,当信息按照逻辑上的自然顺序排列时,模...
-
腾讯会议AI小助手上线 基于“混元”大模型打造
今天,腾讯公关总监张军激动地向公众宣布,腾讯会议AI小助手正式上线。他强调,这一创新应用代表了真正的大模型技术的力量。 根据官方网站的详细介绍,这款AI小助手能够全面覆盖会议的各个环节。通过简洁自然的指令,它能够完成信息提取、内容分析、智能提醒等复杂任务...
-
Gemini一眼识破Sora视频是AI生成?百万token上下文能力碾压GPT-4
当谷歌Gemini 1.5,遇上抢了它头条的「罪魁祸首」Sora会怎么样? 这两天,拿到内测资格的AI圈大佬们,纷纷给广大网友来了一波在线测试。 这不,Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。 对此,Gemini...