-
当AI与数学同时走下神坛
2024年4月13日,一场特别的考试开考。 数万名分散在全球各地的数学高手,在这一天早上8点打开了阿里巴巴全球数学竞赛预赛的试卷,他们有48小时,来攻克20分的选择题和100分的解答题。过去的6届,天才们在这个赛事里亮相,有17岁拿下IMO满分金牌的北大神...
-
超详细!AIGC面试系列 大模型进阶(2)
本期问题快览 1. 如何让大模型处理更长的文本? 2. 如果想要在某个模型基础上做全参数微调,究竟需要多少显存? 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后,通用能力往往会有所下降,如何缓解模型遗忘...
-
为何说小语言模型是AI界的下一大热门?
译者 | 布加迪 审校 | 重楼 在AI领域,科技巨头们一直在竞相构建越来越庞大的语言模型,如今出现了一个令人惊讶的新趋势:小就是大。随着大语言模型(LLM)方面的进展出现了停滞的迹象,研究人员和开发人员日益开始将注意力转向小语言模型(SLM)。这种紧凑...
-
OpenAI 首次推出 GPT-4o“全能”模型,干翻所有语音助手
OpenAI 在本周一(2024年5月13号 推出了一款名为 GPT-4o 的新旗舰级生成式AI模型。这里的“o”代表“全能”,因为这款模型能够处理文本、语音和视频三种不同的输入。在未来几周内,GPT-4o 将逐步应用于公司针对开发者和消费者的各类产品。...
-
AI PC,是联想们的销量解药吗?
4月16日,AMD推出了适用于商用笔记本电脑和台式机的AI芯片;英特尔去年底就推出了Core Ultra芯片,今年还计划推出新一代英特尔酷睿Ultra客户端处理器家族,并预计年出货4000万台AI PC。 随着全球芯片制造商的AI技术越来越成熟,不断推出新...
-
小即是大?HuggingFace CEO预测小模型元年将至,将成为AI的下一个“大事件”
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能领域的竞争中,科技巨头们一直在竞相构建越来越大的语言模型。Scaling Law 信仰随着模型规模的增加,其性能会指数提升,展现出更好的泛化能力,甚至在某些情况下展现出“...
-
中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR
中山大学HCP实验室联合Sea AI Lab和哈佛大学等单位开展的一项研究,成功地让大型人工智能模型通过讲笑话的方式,探索多模态大模型的创造力,并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。 这项研究的关键在于使用来自日本的“大喜利”(Oo...
-
阿里开源的32B大模型到底强在哪里?你知道吗?
阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢? 更高的性价比 Qwen1.5-32B中的B是billion的意思,也就是10亿,32B就代表320亿参数量。 阿里之前还开源过一个大模型Qwe...
-
大模型投资2024:阿里腾讯,争做一号“金主”
以国内大模型初创企业主要投资方的身份,腾讯和阿里再次站在了“金主爸爸”的位置。 2023年至今,这两家曾经的投资大户不约而同地大幅减少了自己的出手次数。据天眼查公开数据,2023年一整年,腾讯投资仅出手33次,平均每月不足3次。而2021年和2022年,腾...
-
伊克罗德信息与墨奇科技战略合作,共塑生成式AI未来
在数字化浪潮席卷全球的今天,人工智能技术以其强大的潜力和广泛的应用前景,正引领着新一轮的科技革命。 近日,伊克罗德信息与墨奇科技正式宣布双方达成战略合作,双方将围绕生成式AI技术展开,发挥各自的技术优势和资源优势,利用大语言模型LLM、向量数据库构建生成...
-
教育GPT是怎样炼成的?
2024年1月,OpenAI官宣GPTs(商城)正式上线。 至此,程序员的门槛被再次降低,只要有足够的创造力和想象力,每个人都可以根据自己的专业知识创造一个GPT工具的时代已经到来。 在GPTs上线后,至顶网发现,教育类目很快成了被官方推荐的一个热门类...
-
用火车头采集图片的艺术和策略
随着互联网技术的快速发展和信息的日益庞杂,高效的信息收集和数据抓取工具备受用户的追捧。“火车头”作为一个强有力的采集工具,在其中独树一帜。本文主要聚焦于利用“火车头”来采集图片的技术与策略,通过多个维度的详尽解读,希望能够给予相关领域人员实质性的启示。在启...
-
我用GPT-4参加阿里数学竞赛!官方:今年欢迎,七万奖金凭本事拿走
大模型要在数学竞赛上跟人类同场竞技啦! 最新消息,阿里巴巴全球数学竞赛,今日官宣开启报名。依然不限年龄、国籍、职业,有意思的是,这次甚至突破了碳基硅基的限制—— 首次向AI开放,诚邀全球大模型参赛。 不仅如此,获胜AI最高还可获得10000美元(约合7....
-
ChatLaw:基于LLaMA微调的法律大模型
文章目录 动机 数据组成 模型框架 模型评估 北大团队发布首个的中文法律大模型落地产品ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。 github地址:https://g...
-
GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评
近期,多模态大模型(LMMs)在视觉语言任务方面展示了令人印象深刻的能力。然而,由于多模态大模型的回答具有开放性,如何准确评估多模态大模型各个方面的性能成为一个迫切需要解决的问题。 目前,一些方法采用GPT对答案进行评分,但存在着不准确和主观性的问题。另...
-
Mistral-Medium意外泄露?冲上榜单的这个神秘模型让AI社区讨论爆了
「我现在 100% 确信 Miqu 与 Perplexity Labs 上的 Mistral-Medium 是同一个模型。」 近日,一则关于「Mistral-Medium 模型泄露」的消息引起了大家的关注。 泄露传闻与一个名为「Miqu」的新模型有关,在...
-
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。 在这一背景下,M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...
-
无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用
随着人工智能技术的发展,以 GPT-4 为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。与此同时,大模型本身的安全性问题也变得尤为重要。如何确保大语言模型可以和人类的价值、真实的意图相一致,防止模型被滥用、输出有害的信息,这是大模型安全治理的...
-
如何用AIGC技术讲好中医药文化故事
中医药文化是中国古代文化的重要组成部分,它包含了丰富的知识和理念,如阴阳五行理论、脏腑经络理论、诊疗方法等。这些知识和理念不仅在医学上有深远的影响,也在哲学、艺术、宗教等领域产生了深远的影响。然而,由于历史和现实的原因,中医药文化在国内外的传播和认知上还存...
-
【AIGC】用货拉拉拉不拉拉布拉多的梗调(ce)戏(shi)AI大模型,3.5和4.0的反应差别巨大!
目录 一、调戏LLM大模型 (一)制造陷阱——货拉拉拉拉布拉多的梗 1.看看3.5的表现 2.看看4.0的表现 (二)用简单推理调戏大模型 1.看看3.5的表现 2.看看4.0的表现 3.看看3.5的表现 4.看看4.0的表现 (三)用...
-
【AIGC】baichuan-7B大模型
百川智能|开源可商用的大规模预训练语言模型baichuan-7B大模型 概述 baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持...
-
Gemini Pro还不如GPT-3.5,CMU深入对比研究:保证公平透明可重复
谷歌Gemini实力到底如何?卡耐基梅隆大学来了场专业客观第三方比较。 为保证公平,所有模型使用相同的提示和生成参数,并且提供可重复的代码和完全透明的结果。 不会像谷歌官方发布会那样,用CoT@32对比5-shot了。 一句话结果:Gemini Pr...
-
可以媲美MidJourney,但是开源和免费的超强AI绘画-fooocus
现在的AI技术很火,这一新兴领域的发展给艺术创作带来了全新的可能性,AI绘画的应用也十分的广泛。我自己见到的就有运用在模特穿衣服身上的,化妆品广告图生成的等等,比如MidJourney 和stable diffusion 等 AI绘画程序已经很成熟了,前者...
-
ChatGPT模型在神经学考试中表现出色,超越人类学生水平
近期发表在JAMA Network Open期刊的一项研究中,研究人员评估了两个ChatGPT大型语言模型(LLMs)在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现,其中一个...
-
中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用
“ Meta 开源 LLAMA2 后,国内出现了不少以此为基座模型训练的中文模型,这次我们来看看其中一个不错的中文模型:Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中,比较有名的是Meta的LLAM...
-
谷歌Bard:ChatGPT之外的第三选择
2023年年初,为了对应ChatGPT方面的压力,谷歌Bard仓促上线,此后便进入了低调前行。目前为止已经迭代了9个版本,也就是在近期的版本更新中支持了中文(简体/繁体)语言,对国内用户可以说又友好了一步。 https://bard.go...
-
全面开放!Google Bard使用教程
一 前言 在2002.5.12举办的Google I/O发布会上,Google宣布从即日起将Bard全面开放,全球超过180个国家只要点击进入bard.google.com,无需等候就能使用。 Bard有哪些特点?通过与ChatGPT的对比,就可以很快...
-
LLMs之Colossal-LLaMA-2:Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本)、安装、使用方法之详细攻略
LLMs之Colossal-LLaMA-2:Colossal-LLaMA-2的简介(基于LLaMA-2架构+中文优化+扩充词表+仅千美元成本 、安装、使用方法之详细攻略 导读:2023年9月25日,Colossal-AI团队推出了开源模型Colos...
-
Google Bard使用初体验,与ChatGPT比较到底怎么样
文章目录 Google Bard 介绍 如何使用Google bard bard和ChatGPT3.5的区别 本文讲述了Google bard的入门教程和使用技巧,并且与竞争对手ChatGPT进行了一个全方面的比较。这是 Goo...
-
GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了?
近期研究显示,GPT-4V在医学执照考试中表现优异,准确率远超过大部分医学生。这为AI在医学临床中的应用提供了新的可能性。尽管人工智能在医学影像诊断方面取得了显著进展,医生仍难以完全信任其诊断结果,需要额外的认知成本。 为了增强医生对人工智能的信任,研究团...
-
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
人工智能(AI)在医学影像诊断方面的应用已经有了长足的进步。然而,在未经严格测试的情况下,医生往往难以采信人工智能的诊断结果。对于他们来说,理解人工智能根据医学影像给出的判别,需要增加额外的认知成本。 为了增强医生对辅助医疗的人工智能之间的信任,让 AI...
-
云计算与大数据第8章 大数据采集习题及答案
第8章 大数据采集习题 8.1 选择题 1、数据采集的数据对象类型包括( D )。 A. 结构化数据 B. 半结构化数据 C. 非结构化数据 D. 以上都是 2、数据采集的主要性能要求不包括以下的( B ...
-
使用SpreadJS 开发在线问卷系统,构筑CCP(云数据采集)平台
什么是CCP(云数据采集)平台? 图片来自于网络 CCP(云数据采集)平台诞生于大数据时代的背景下,通过实时数据挖掘,在海量的云端数据中发现隐藏其中的价值。 在线问卷系统,作为CCP(云数据采集)平台的信息采集接口,通过网络信息收集,帮助问卷设计...
-
马斯克xAI公布大模型详细进展,Grok只训练了2个月
近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ,直接把网友的好奇心拉满。 和总是一本正经回答问题的 ChatGPT 不同,Grok 自带幽默和嘲讽技能。 就像下图所展示的,Grok 在被...
-
蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval
蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。 该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题,共计4850道题目。 此外,还针对 AIOps 任务做了细分,并添加了日...
-
Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树
到底什么才是LLM长上下文模型的终极解决方案? 最近由普林斯顿大学和Meta AI的研究者提出了一种解决方案,将LLM视为一个交互式智能体,让它决定如何通过迭代提示来读取文本。 论文地址:https://arxiv.org/abs/2310.05029...
-
DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案
大语言模型又一项重大缺陷被DeepMind曝光! LLM无法纠正自己推理中的错误。 「Self-Correction」作为一种让模型修正自己回答的技术,在很多类型的任务中都能明显改进模型的输出质量。 但是最近,谷歌DeepMind和UIUC的研究人员却发...