开源大模型第4页

国产开源模型标杆大升级，重点能力比肩ChatGPT！书生·浦语2.0发布，支持免费商用

1月17日，新一代大语言模型书⽣·浦语2.0（InternLM2）正式发布并开源。 2种参数规格、3种模型版本，共计6个模型，全部免费可商用。它支持200K超长上下文，可轻松读200页财报。200K文本全文范围关键信息召回准确率达95.62%。不...

生成式AI 2024-01-18 人工智能

931阅读

AI视野：智谱AI发布大模型GLM-4；腾讯发布PhotoMaker；GPT Store现多款违规AI女友；Deepfake音视频检测技术亮相CES

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ????大模型动态智谱AI发布大...

生成式AI 2024-01-16 人工智能

898阅读

元象开源大模型XVERSE-Long-256K 支持输入25万汉字

元象发布了全球首个上下文窗口长度为256K 的开源大模型 XVERSE-Long-256K，支持输入25万汉字，无条件免费商用。该模型填补了开源生态空白，与元象之前的大模型组成了高性能全家桶。XVERSE-Long-256K 在评测中表现出色，超越了其他...

大数据 2024-01-16 人工智能

1044阅读

当AI变成“守法公民”，为何用户反而不爱它了

ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在，但投入AI大模型赛道的显然远远不止OpenAI一家，例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢，比如创业...

大数据 2024-01-15 人工智能

867阅读

360周鸿祎：2024年大模型将像PC电脑一样无处不在

快科技1月7日消息，在2023年风马牛年终秀上”，360集团创始人周鸿祎分享了对2024年大模型发展趋势的十大预测。他呼吁：企业树立AI信仰，All in AI。他认为创新才能破局，未来最大的创新机会在大模型。据悉，周鸿祎提到的2024年大模型发展趋势...

人工智能 2024-01-07 人工智能

833阅读

新一轮工业革命！周鸿祎呼吁All in AI：2024将出现杀手级应用

快科技1月5日消息，今晚举办的2023年风马牛年终秀”上，360创始人周鸿祎呼吁All in AI，未来最大的创新机会在大模型。周鸿祎表示：大模型已经开启新一轮工业革命，不发展是最大的不安全。周鸿祎建议企业将含AI量”作为业务考核指标，倒逼企业完成数字...

生成式AI 2024-01-06 人工智能

862阅读

周鸿祎分享2024年大模型发展趋势的十大预测：将出现杀手级应用

划重点: 日前，三六零（360）创始人周鸿祎在“2023年风马牛年终秀”上分享了对2024年大模型发展趋势的十大预测，呼吁企业全面投入AI，树立“AI信仰”。周鸿祎认为，未来的创新机会将主要集中在大模型领域，因此提出了对大模型发展趋势的十大预测。周...

大数据 2024-01-06 人工智能

869阅读

周鸿祎公布2024大模型十大趋势判断：原子弹变茶叶蛋

快科技1月6日消息，昨晚举办的2023年风马牛年终秀”上，360创始人周鸿祎分享了自己关于2024大模型的十大趋势判断。周鸿祎表示：大模型将成为数字系统标配，就像当年的PC一样，无处不在。而且2024年开源大模型将爆发，让大模型从原子弹”变成茶叶蛋”，...

AIGC 2024-01-06 人工智能

732阅读

年度最热AI应用TOP 50，除了ChatGPT还有这么多宝藏

百模齐发、AI工具乱杀的一年里，谁是真正赢家？ ChatGPT访问量遥遥领先位居第一，但单次使用时长没超过平均线。 Midjourney访问量年度第四，但下滑量位居第二。引爆AI绘画趋势的Stable Diffusion，年度访问量居然没进前20名？...

人工智能 2024-01-02 人工智能

918阅读

Mistral 欧洲最强模型团队的野望；国内大模型都是套壳LLaMA？Claude官方提示词教程-中英双语；AI原生应用难产了；AI Agents实践经验 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 看热闹不嫌事大！马斯克：OpenAI首席科学家 Ilya 应该跳槽到xAI https://www.businessinsider.com/...

人工智能 2024-01-01 人工智能

1126阅读

《大模型AIGC系列课程》大纲

第1章：初识ChatGPT 【大模型AIGC系列课程 1-1】ChatGPT与OpenAI API的应用【大模型AIGC系列课程 1-2】创建并部署自己的ChatGPT机器人第2章：LLM的第二大脑【大模型AIGC系列课程 2-1...

AIGC 2023-12-31 人工智能

890阅读

两只羊驼掐头去尾拼一起，屠榜HuggingFace

HuggingFace开源大模型排行榜，又被屠榜了。前排被清一色的SOLAR 10.7B微调版本占据，把几周之前的各种Mixtral 8x7B微调版本挤了下去。 SOLAR大模型什么来头？相关论文刚刚上传到ArXiv，来自韩国公司Upstage A...

生成式AI 2023-12-29 人工智能

806阅读

Gemini偷师文心一言？这一局，百度给中国大模型找回了面子！

大数据产业创新服务媒体 ——聚焦数据 · 改变商业在模型表现方面，百度文心一言、阿里通义千问、华为盘古、腾讯混元、科大讯飞星火等，都在说超过ChatGPT-3.5，马上要追上GPT-4，甚至在某些领域的表现超越了GPT-4。...

生成式AI 2023-12-28 人工智能

927阅读

得物大模型平台，业务效果提升实践

一、背景得物大模型训练与推理平台上线几个月后，我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面，取得了显著的成效，例如：效率相关部门的合作，多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务，提升了效...

大数据 2023-12-27 人工智能

840阅读

ChatNBX官网体验入口 AI聊天软件app免费下载地址

ChatNBX 是一款先进的人工智能工具，主要用于研究和演示。这个下一代聊天界面结合了类似 ChatGPT 的用户界面和在后台运行的开源大模型。它基于强大的语言模型，提供智能的对话交互，适用于从日常娱乐到商业问题解答的多种场景。点击前往ChatNBX官...

AIGC 2023-12-26 人工智能

811阅读

零一万物回应「抄袭 LLaMA」；京东原副总裁试用可穿戴人工喉丨 RTE 开发者日报 Vol.85

开发者朋友们大家好：这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE （Real Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的...

AIGC 2023-12-24 人工智能

868阅读

清华特奖焦剑涛大模型创业：突破GPT-4工具使用能力，搞开源种子轮融资七千万

两位清华校友打造，在GPT-4核心优势之一使用工具上实现超越。连HuggingFace CEO都来帮它造势：它的名字叫“NexusRaven”，参数只有130亿。出色的函数调用能力连网友都忍不住称赞，既可以并行也可以嵌套。背后团队则更令人瞩目...

AIGC 2023-12-24 人工智能

838阅读

LLaMA系列模型

1.LLama 1.1 简介 Open and Efficient Foundation Language Models (Open但没完全Open的LLaMA 2023年2月，Meta（原Facebook）推出了LLaMA大模型，使用了1.4...

生成式AI 2023-12-22 人工智能

948阅读

国内首个官方大模型评测结果出炉！阿里云通义千问首批通过评测

快科技12月22日消息，国内首个官方大模型标准符合性评测”结果公布。阿里云通义千问成为首批通过评测的四款国产大模型之一，在通用性、智能性等维度均达到国家相关标准要求。据悉，本次通过评测的首批大模型中，通义千问是唯一的开源模型，在全球拥有广泛的开发者用户...

AIGC 2023-12-22 人工智能

847阅读

关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama

生成式语言大模型，随着chatgpt的爆火，市场上涌现出一批高质量的生成式语言大模型的项目。近期百度飞桨自然语言处理项目paddlenlp发布了2.6版本。更新了以下特性：全面支持主流开源大模型Bloom, ChatGLM, GLM, Llama, OPT...

生成式AI 2023-12-22 人工智能

962阅读

实力强的大模型都有哪些超能力？

前几日，人工智能研究公司OpenAI CEO山姆·奥特曼（Sam Altman）在谈及人工智能这项技术的潜力以及人们对它的担忧时，曾表示“AI发展速度快得吓人，就像停不下来的龙卷风。”可见，人工智能正在以它超前的速度改变世界。在经历了年初人工智能之大...

人工智能 2023-12-22 人工智能

875阅读

年终收官！华为云开发者日·2023年度创享峰会成功举办

12月20日，华为云开发者日·2023年度创享峰会成功举办，众多开发者与技术爱好者齐聚一堂，在现场，有600余名开发者与华为云技术专家共同就大模型应用、CodeArts软件开发等技术话题进行深入探讨，分享实战技巧与解决方案。此外，华为云还精心设置了Koo...

人工智能 2023-12-21 人工智能

850阅读

together.ai让AI模型训练快9倍，获NVIDIA参投1.025亿美元A轮融资

目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic，而这两家公司最大的投资者分别是微软和亚马逊，他们投资的很大一部分不是资金，而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。在闭源大模型之外，...

大数据 2023-12-21 人工智能

972阅读

ChatGPT构建离不开PyTorch，LeCun言论引热议，模型厂商不开放权重原来为此

这两天，有关开源的话题又火了起来。有人表示，「没有开源，AI 将一无所有，继续保持 AI 开放。」这个观点得到了很多人的赞同，其中包括图灵奖得主、Meta 首席科学家 Yann LeCun。想象一下，如果工业界的 AI 研究实验室仍然封闭、没有开源代码...

人工智能 2023-12-18 人工智能

867阅读

【LLM】大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2：Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调（SFT）人...

大数据 2023-12-18 人工智能

998阅读

大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型

图1.1 GPT-2 模型结构关于训练集，其来源都是公开数据集，无任何定制数据集，保证了其工作与开源兼容和可复现。整个训练数据集在 token 化之后大约包含 1.4T 的 token。其中，LLaMA-65B 和 LLaMA-33B 是在 1.4万亿...

AIGC 2023-12-18 人工智能

973阅读

Llama-2大模型本地部署研究与应用测试

最近在研究自然语言处理过程中，正好接触到大模型，特别是在年初chatgpt引来的一大波AIGC热潮以来，一直都想着如何利用大模型帮助企业的各项业务工作，比如智能检索、方案设计、智能推荐、智能客服、代码设计等等，总得感觉相比传统的搜索和智能化...

大数据 2023-12-18 人工智能

1019阅读

2024年AI趋势看这张图，LeCun：开源大模型要超越闭源

2023 年即将过去。一年以来，各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时，另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀？是否能够媲美专有模型的性能？迄今为止，我们一直还只能说...

生成式AI 2023-12-12 人工智能

784阅读

开源大模型超越GPT-3.5！爆火MoE实测结果出炉，网友：OpenAI越来越没护城河了

一条神秘磁力链接引爆整个AI圈，现在，正式测评结果终于来了：首个开源MoE大模型Mixtral 8x7B，已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。（对，就是传闻中GPT-4的同款方案。）并且由于是稀疏模型，处理每个toke...

人工智能 2023-12-12 人工智能

847阅读

通义千问72B模型登顶Hugging Face开源大模型预训练模型榜首

开源大模型社区Hugging Face公布了最新的开源大模型排行榜，通义千问在预训练模型类别中脱颖而出，占据榜首位置。 Hugging Face开源大模型排行榜涵盖了全球上百个顶尖的开源大模型，并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面...

AIGC 2023-12-11 人工智能

850阅读

开源模型「幻觉」更严重，这是三元组粒度的幻觉检测套件

大模型长期以来一直存在一个致命的问题，即生成幻觉。由于数据集的复杂性，难免会包含过时和错误的信息，这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见，这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课...

生成式AI 2023-12-10 人工智能

991阅读

AI 绘画工具 Stable Diffusion 本地安装使用

最近要用到 AI 绘画，所以研究了下目前市面上的 AI 绘画工具，真可谓是琳琅满目，但主流的还是 Stable diffusion 和 Midjourney 两大阵营。 Midjourney 不多说，开箱即用，对新手非常友好，但不免费，Stable di...

人工智能 2023-12-10 人工智能

871阅读

首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集

“取消今晚所有计划！”，许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由Mistral AI发布。 MoE架构全称专家混合（Mixture-of-Experts），也就是传闻中GPT-4采用的方案，可以说这是开源大模型离GPT-4最近的一集...

人工智能 2023-12-09 人工智能

895阅读

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

已上微软 Azure，即将要上 AWS、Hugging Face。一夜之间，大模型格局再次发生巨变。一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。今日，Meta 终于发布了大家期待...

生成式AI 2023-12-09 人工智能

886阅读

“过度炒作”的大模型巨亏，Copilot每月收10刀,倒赔20刀

大模型无论是训练还是使用，都比较“烧钱”，只是其背后的成本究竟高到何处？已经推出大模型商用产品的公司到底有没有赚到钱？事实上，即使微软、亚马逊、Adobe 这些大厂，距离盈利之路还有很远！同时，使用这些大模型工具的人越多，相关企业需要支付基础设施的费用就越...

大数据 2023-12-08 人工智能

1004阅读

AIGC周报｜周鸿祎：不会用GPT的人未来将被淘汰；蔡崇信：不用过于担心AI未来会取代人类；AI翻唱或涉多项侵权行为

AIGC（AI Generated Content）即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT，以及 Dall·E 2、Stable Diffusion 等文生图模型，都属于 AIGC 的典型案例，它们通过借鉴现有的、人类创造的内容来...

大数据 2023-12-08 人工智能

852阅读

大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现，这两步都不是必要的？？？新论文指出，预训练完成刚出炉的基础模型已经掌握了遵循指令的能力，只需要提示工程就能引导出来，引起...

AIGC 2023-12-06 人工智能

847阅读

中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用

“ Meta 开源 LLAMA2 后，国内出现了不少以此为基座模型训练的中文模型，这次我们来看看其中一个不错的中文模型：Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中，比较有名的是Meta的LLAM...

AIGC 2023-12-05 人工智能

1281阅读

AI大模型，如何破圈而出？

一年即将过去，回望整个2023，我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里，全球兴起了数百个大模型。根据相关报道，仅仅在中国就有超过200个大模型，形成了名副其实的“百模大战”。但有个问题不知道大家注意到没有?大模型虽多，但真正用到大模型的...

人工智能 2023-12-05 人工智能

885阅读

LoRA微调stable diffusion models：原理和实战

Diffusion Models专栏文章汇总：入门与实战前言：AIGC大模型(如stable diffusion models 的训练成本已经超过绝大多数人的承受范围，如何利用已有的开源大模型，花费较小的成本微调出属于自己的专有模型？现在微调...

人工智能 2023-12-05 人工智能

767阅读

微调语言大模型选LoRA还是全参数？基于LLaMA 2深度分析

本文对比了全参数微调和LoRA，并分析了这两种技术各自的优势和劣势。作者使用了三个真实用例来训练LLaMA 2模型，这提供了比较特定任务的性能、硬件要求和训练成本的基准。本文证明了使用LoRA需要在serving效率和模型质量之间做出权衡，而这...

AIGC 2023-12-05 人工智能

1027阅读

灵雀云Alauda MLOps 现已支持 Meta LLaMA 2 全系列模型

在人工智能和机器学习领域，语言模型的发展一直是企业关注的焦点。然而，由于硬件成本和资源需求的挑战，许多企业在应用大模型时仍然面临着一定的困难。为了帮助企业更好地应对上述挑战，灵雀云于近日宣布，企业可通过Alauda MLOps（以下简称AML）使用由 Me...

大数据 2023-12-04 人工智能

805阅读

国产开源大模型，起风了

科技的浪潮几十年一个轮回，不同的剧本却总是响起相似的鼓点。如果说，一年前ChatGPT的惊艳现身，是属于大模型时代的「iPhone时刻」;那么，7月间Meta将Llama2开源，则被认为是拉开了大模型时代的IOS与安卓之争。但区别于移动互联网时代，大模...

人工智能 2023-12-04 人工智能

922阅读

720亿参数大模型都拿来开源了！通义千问开源全家桶，最小18亿模型端侧都能跑

「Qwen-72B 模型将于 11 月 30 日发布。」前几天，X 平台上的一位网友发布了这样一则消息，消息来源是一段对话。他还说，「如果（新模型）像他们的 14B 模型一样，那将是惊人的。」有位网友转发了帖子并配文「千问模型最近表现不错」。这句话...

大数据 2023-12-01 人工智能

956阅读

280万大模型中文开发者拿到最后一块拼图

2023年5月，微软CEO纳德拉抛出一个惊人数字，未来全球的开发者数量将会达到10亿。那时候Meta的Llama已经开源4个月，但一些国内的开发者发现，从小以英文语料喂养起来的Llama，对中文世界并不友好。这未来的“10亿”开发者里会有多少中文开发者...

生成式AI 2023-12-01 人工智能

852阅读

通义千问720亿参数模型开源，率先实现“全尺寸全模态”开源

12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源的GPT-3.5和GPT-4。在英语任务上，Qwen-72B在MMLU基准测...

AIGC 2023-12-01 人工智能

993阅读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮，也有很多相关工作不断涌现。最近Meta全新发布了Llama-2，效果更上一层楼。而且最重要的是模型可以相对随意分发了，不像一代一样，meta不让开发者发布基于llama模型训...

大数据 2023-11-26 人工智能

1031阅读

Hugging Face最受欢迎15大AI机构出炉！清华第五，OpenAI第十，冠军竟是它？

【新智元导读】Hugging Face作为开源AI社区的代表，总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里，哪些机构对于开源AI贡献最大。 Hugging Face上最受欢迎的15个AI公司出炉了! 目前的冠军，是Stability AI...

生成式AI 2023-11-24 人工智能

918阅读

AI生成视频入局新卷王，上线不到48小时，网友“大片”刷屏X

AI视频生成工具卷起来了! 本周二，Stability AI低调发布了首个开源AI视频模型Stable Video Diffusion（以下简称SVD），同时还晒出测试数据称，SVD的模型性能碾压RunwayML、Pika Labs等领先的闭源商业模型。...

AIGC 2023-11-24 人工智能

963阅读