-
国产开源模型标杆大升级,重点能力比肩ChatGPT!书生·浦语2.0发布,支持免费商用
1月17日,新一代大语言模型书⽣·浦语2.0(InternLM2)正式发布并开源。 2种参数规格、3种模型版本,共计6个模型,全部免费可商用。 它支持200K超长上下文,可轻松读200页财报。200K文本全文范围关键信息召回准确率达95.62%。 不...
-
AI视野:智谱AI发布大模型GLM-4;腾讯发布PhotoMaker;GPT Store现多款违规AI女友;Deepfake音视频检测技术亮相CES
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ????大模型动态 智谱AI发布大...
-
元象开源大模型XVERSE-Long-256K 支持输入25万汉字
元象发布了全球首个上下文窗口长度为256K 的开源大模型 XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。 该模型填补了开源生态空白,与元象之前的大模型组成了高性能全家桶。XVERSE-Long-256K 在评测中表现出色,超越了其他...
-
最新开源!更擅长推理的LLaMA大模型,支持中文
©PaperWeekly 原创 · 作者 | 李忠利 研究方向 | 自然语言处理 跟大家介绍一下自己最近训练的 LLaMA 模型——BiLLa: A Bilingual LLaMA with Enhanced Reasoning Abi...
-
当AI变成“守法公民”,为何用户反而不爱它了
ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在,但投入AI大模型赛道的显然远远不止OpenAI一家,例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢,比如创业...
-
360周鸿祎:2024年大模型将像PC电脑一样无处不在
快科技1月7日消息,在2023年风马牛年终秀上”,360集团创始人周鸿祎分享了对2024年大模型发展趋势的十大预测。 他呼吁:企业树立AI信仰,All in AI。他认为创新才能破局,未来最大的创新机会在大模型。 据悉,周鸿祎提到的2024年大模型发展趋势...
-
新一轮工业革命!周鸿祎呼吁All in AI:2024将出现杀手级应用
快科技1月5日消息,今晚举办的2023年风马牛年终秀”上,360创始人周鸿祎呼吁All in AI,未来最大的创新机会在大模型。 周鸿祎表示:大模型已经开启新一轮工业革命,不发展是最大的不安全。 周鸿祎建议企业将含AI量”作为业务考核指标,倒逼企业完成数字...
-
周鸿祎分享2024年大模型发展趋势的十大预测:将出现杀手级应用
划重点: 日前,三六零(360)创始人周鸿祎在“2023年风马牛年终秀”上分享了对2024年大模型发展趋势的十大预测,呼吁企业全面投入AI,树立“AI信仰”。 周鸿祎认为,未来的创新机会将主要集中在大模型领域,因此提出了对大模型发展趋势的十大预测。 周...
-
周鸿祎公布2024大模型十大趋势判断:原子弹变茶叶蛋
快科技1月6日消息,昨晚举办的2023年风马牛年终秀”上,360创始人周鸿祎分享了自己关于2024大模型的十大趋势判断。 周鸿祎表示:大模型将成为数字系统标配,就像当年的PC一样,无处不在。 而且2024年开源大模型将爆发,让大模型从原子弹”变成茶叶蛋”,...
-
年度最热AI应用TOP 50,除了ChatGPT还有这么多宝藏
百模齐发、AI工具乱杀的一年里,谁是真正赢家? ChatGPT访问量遥遥领先位居第一,但单次使用时长没超过平均线。 Midjourney访问量年度第四,但下滑量位居第二。 引爆AI绘画趋势的Stable Diffusion,年度访问量居然没进前20名?...
-
Mistral 欧洲最强模型团队的野望;国内大模型都是套壳LLaMA?Claude官方提示词教程-中英双语;AI原生应用难产了;AI Agents实践经验 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 看热闹不嫌事大!马斯克:OpenAI首席科学家 Ilya 应该跳槽到xAI https://www.businessinsider.com/...
-
《大模型AIGC系列课程》大纲
第1章:初识ChatGPT 【大模型AIGC系列课程 1-1】ChatGPT与OpenAI API的应用 【大模型AIGC系列课程 1-2】创建并部署自己的ChatGPT机器人 第2章:LLM的第二大脑 【大模型AIGC系列课程 2-1...
-
两只羊驼掐头去尾拼一起,屠榜HuggingFace
HuggingFace开源大模型排行榜,又被屠榜了。 前排被清一色的SOLAR 10.7B微调版本占据,把几周之前的各种Mixtral 8x7B微调版本挤了下去。 SOLAR大模型什么来头? 相关论文刚刚上传到ArXiv,来自韩国公司Upstage A...
-
Gemini偷师文心一言?这一局,百度给中国大模型找回了面子!
大数据产业创新服务媒体 ——聚焦数据 · 改变商业 在模型表现方面,百度文心一言、阿里通义千问、华为盘古、腾讯混元、科大讯飞星火等,都在说超过ChatGPT-3.5,马上要追上GPT-4,甚至在某些领域的表现超越了GPT-4。...
-
得物大模型平台,业务效果提升实践
一、背景 得物大模型训练与推理平台上线几个月后,我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面,取得了显著的成效,例如: 效率相关部门的合作,多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务,提升了效...
-
ChatNBX官网体验入口 AI聊天软件app免费下载地址
ChatNBX 是一款先进的人工智能工具,主要用于研究和演示。这个下一代聊天界面结合了类似 ChatGPT 的用户界面和在后台运行的开源大模型。它基于强大的语言模型,提供智能的对话交互,适用于从日常娱乐到商业问题解答的多种场景。 点击前往ChatNBX官...
-
零一万物回应「抄袭 LLaMA」;京东原副总裁试用可穿戴人工喉丨 RTE 开发者日报 Vol.85
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的...
-
清华特奖焦剑涛大模型创业:突破GPT-4工具使用能力,搞开源种子轮融资七千万
两位清华校友打造,在GPT-4核心优势之一使用工具上实现超越。 连HuggingFace CEO都来帮它造势: 它的名字叫“NexusRaven”,参数只有130亿。 出色的函数调用能力连网友都忍不住称赞,既可以并行也可以嵌套。 背后团队则更令人瞩目...
-
LLaMA系列模型
1.LLama 1.1 简介 Open and Efficient Foundation Language Models (Open但没完全Open的LLaMA 2023年2月,Meta(原Facebook)推出了LLaMA大模型,使用了1.4...
-
国内首个官方大模型评测结果出炉!阿里云通义千问首批通过评测
快科技12月22日消息,国内首个官方大模型标准符合性评测”结果公布。 阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。 据悉,本次通过评测的首批大模型中,通义千问是唯一的开源模型,在全球拥有广泛的开发者用户...
-
关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama
生成式语言大模型,随着chatgpt的爆火,市场上涌现出一批高质量的生成式语言大模型的项目。近期百度飞桨自然语言处理项目paddlenlp发布了2.6版本。更新了以下特性:全面支持主流开源大模型Bloom, ChatGLM, GLM, Llama, OPT...
-
实力强的大模型都有哪些超能力?
前几日,人工智能研究公司OpenAI CEO山姆·奥特曼(Sam Altman)在谈及人工智能这项技术的潜力以及人们对它的担忧时,曾表示“AI发展速度快得吓人,就像停不下来的龙卷风。”可见,人工智能正在以它超前的速度改变世界。 在经历了年初人工智能之大...
-
年终收官!华为云开发者日·2023年度创享峰会成功举办
12月20日,华为云开发者日·2023年度创享峰会成功举办,众多开发者与技术爱好者齐聚一堂,在现场,有600余名开发者与华为云技术专家共同就大模型应用、CodeArts软件开发等技术话题进行深入探讨,分享实战技巧与解决方案。此外,华为云还精心设置了Koo...
-
together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资
目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic,而这两家公司最大的投资者分别是微软和亚马逊,他们投资的很大一部分不是资金,而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。 在闭源大模型之外,...
-
ChatGPT构建离不开PyTorch,LeCun言论引热议,模型厂商不开放权重原来为此
这两天,有关开源的话题又火了起来。有人表示,「没有开源,AI 将一无所有,继续保持 AI 开放。」这个观点得到了很多人的赞同,其中包括图灵奖得主、Meta 首席科学家 Yann LeCun。 想象一下,如果工业界的 AI 研究实验室仍然封闭、没有开源代码...
-
【LLM】大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model
大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model 快速了解 预训练 预训练模型评估 微调 有监督微调(SFT) 人...
-
大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型
图1.1 GPT-2 模型结构 关于训练集,其来源都是公开数据集,无任何定制数据集,保证了其工作与开源兼容和可复现。整个训练数据集在 token 化之后大约包含 1.4T 的 token。其中,LLaMA-65B 和 LLaMA-33B 是在 1.4万亿...
-
Llama-2大模型本地部署研究与应用测试
最近在研究自然语言处理过程中,正好接触到大模型,特别是在年初chatgpt引来的一大波AIGC热潮以来,一直都想着如何利用大模型帮助企业的各项业务工作,比如智能检索、方案设计、智能推荐、智能客服、代码设计等等,总得感觉相比传统的搜索和智能化...
-
2024年AI趋势看这张图,LeCun:开源大模型要超越闭源
2023 年即将过去。一年以来,各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时,另一方「势力」悄然崛起 —— 开源。 开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀?是否能够媲美专有模型的性能?迄今为止,我们一直还只能说...
-
开源大模型超越GPT-3.5!爆火MoE实测结果出炉,网友:OpenAI越来越没护城河了
一条神秘磁力链接引爆整个AI圈,现在,正式测评结果终于来了: 首个开源MoE大模型Mixtral 8x7B,已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。 (对,就是传闻中GPT-4的同款方案。) 并且由于是稀疏模型,处理每个toke...
-
通义千问72B模型登顶Hugging Face开源大模型预训练模型榜首
开源大模型社区Hugging Face公布了最新的开源大模型排行榜,通义千问在预训练模型类别中脱颖而出,占据榜首位置。 Hugging Face开源大模型排行榜涵盖了全球上百个顶尖的开源大模型,并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面...
-
开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课...
-
AI 绘画工具 Stable Diffusion 本地安装使用
最近要用到 AI 绘画,所以研究了下目前市面上的 AI 绘画工具,真可谓是琳琅满目,但主流的还是 Stable diffusion 和 Midjourney 两大阵营。 Midjourney 不多说,开箱即用,对新手非常友好,但不免费,Stable di...
-
首个开源MoE大模型发布!7Bx8个专家,离GPT-4最近的一集
“取消今晚所有计划!”,许多AI开发者决定不睡了。 只因首个开源MoE大模型刚刚由Mistral AI发布。 MoE架构全称专家混合(Mixture-of-Experts),也就是传闻中GPT-4采用的方案,可以说这是开源大模型离GPT-4最近的一集...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
“过度炒作”的大模型巨亏,Copilot每月收10刀,倒赔20刀
大模型无论是训练还是使用,都比较“烧钱”,只是其背后的成本究竟高到何处?已经推出大模型商用产品的公司到底有没有赚到钱?事实上,即使微软、亚马逊、Adobe 这些大厂,距离盈利之路还有很远!同时,使用这些大模型工具的人越多,相关企业需要支付基础设施的费用就越...
-
AIGC周报|周鸿祎:不会用GPT的人未来将被淘汰;蔡崇信:不用过于担心AI未来会取代人类;AI翻唱或涉多项侵权行为
AIGC(AI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 Dall·E 2、Stable Diffusion 等文生图模型,都属于 AIGC 的典型案例,它们通过借鉴现有的、人类创造的内容来...
-
大模型免微调解锁对话能力,RLHF没必要了!一作上交大校友:节省大量成本和时间
要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步走。 来自艾伦研究所的新研究却发现,这两步都不是必要的??? 新论文指出,预训练完成刚出炉的基础模型已经掌握了遵循指令的能力,只需要提示工程就能引导出来,引起...
-
中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用
“ Meta 开源 LLAMA2 后,国内出现了不少以此为基座模型训练的中文模型,这次我们来看看其中一个不错的中文模型:Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中,比较有名的是Meta的LLAM...
-
AI大模型,如何破圈而出?
一年即将过去,回望整个2023,我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过200个大模型,形成了名副其实的“百模大战”。 但有个问题不知道大家注意到没有?大模型虽多,但真正用到大模型的...
-
LoRA微调stable diffusion models:原理和实战
Diffusion Models专栏文章汇总:入门与实战 前言:AIGC大模型(如stable diffusion models 的训练成本已经超过绝大多数人的承受范围,如何利用已有的开源大模型,花费较小的成本微调出属于自己的专有模型?现在微调...
-
微调语言大模型选LoRA还是全参数?基于LLaMA 2深度分析
本文对比了全参数微调和LoRA,并分析了这两种技术各自的优势和劣势。作者使用了三个真实用例来训练LLaMA 2模型,这提供了比较特定任务的性能、硬件要求和训练成本的基准。本文证明了使用LoRA需要在serving效率和模型质量之间做出权衡,而这...
-
灵雀云Alauda MLOps 现已支持 Meta LLaMA 2 全系列模型
在人工智能和机器学习领域,语言模型的发展一直是企业关注的焦点。然而,由于硬件成本和资源需求的挑战,许多企业在应用大模型时仍然面临着一定的困难。为了帮助企业更好地应对上述挑战,灵雀云于近日宣布,企业可通过Alauda MLOps(以下简称AML)使用由 Me...
-
国产开源大模型,起风了
科技的浪潮几十年一个轮回,不同的剧本却总是响起相似的鼓点。 如果说,一年前ChatGPT的惊艳现身,是属于大模型时代的「iPhone时刻」;那么,7月间Meta将Llama2开源,则被认为是拉开了大模型时代的IOS与安卓之争。 但区别于移动互联网时代,大模...
-
720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑
「Qwen-72B 模型将于 11 月 30 日发布。」前几天,X 平台上的一位网友发布了这样一则消息,消息来源是一段对话。他还说,「如果(新模型)像他们的 14B 模型一样,那将是惊人的。」 有位网友转发了帖子并配文「千问模型最近表现不错」。 这句话...
-
280万大模型中文开发者拿到最后一块拼图
2023年5月,微软CEO纳德拉抛出一个惊人数字,未来全球的开发者数量将会达到10亿。 那时候Meta的Llama已经开源4个月,但一些国内的开发者发现,从小以英文语料喂养起来的Llama,对中文世界并不友好。 这未来的“10亿”开发者里会有多少中文开发者...
-
通义千问720亿参数模型开源,率先实现“全尺寸全模态”开源
12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。 在英语任务上,Qwen-72B在MMLU基准测...
-
【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验
前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮,也有很多相关工作不断涌现。最近Meta全新发布了Llama-2,效果更上一层楼。而且最重要的是模型可以相对随意分发了,不像一代一样,meta不让开发者发布基于llama模型训...
-
Hugging Face最受欢迎15大AI机构出炉!清华第五,OpenAI第十,冠军竟是它?
【新智元导读】Hugging Face作为开源AI社区的代表,总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里,哪些机构对于开源AI贡献最大。 Hugging Face上最受欢迎的15个AI公司出炉了! 目前的冠军,是Stability AI...
-
AI生成视频入局新卷王,上线不到48小时,网友“大片”刷屏X
AI视频生成工具卷起来了! 本周二,Stability AI低调发布了首个开源AI视频模型Stable Video Diffusion(以下简称SVD),同时还晒出测试数据称,SVD的模型性能碾压RunwayML、Pika Labs等领先的闭源商业模型。...