阅读理解 - AIGC资讯

速通LLaMA1：《LLaMA: Open and Efficient Foundation Language Models》全文解读

文章目录论文总览 1. 创新点和突破点 2. 技术实现与算法创新 3. 架构升级 4. 概念补充 SwiGLU激活函数 AdamW 5. 总结 Abstract Introduction Approach Pre-training...

人工智能 2024-09-18 人工智能

1513阅读

即刻体验 Llama3.1就在Amazon Bedrock!

引言在人工智能的浪潮中，大型语言模型（LLMs）不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列，以其卓越的性能和广泛的应用前景，引起了业界的广泛关注。现在，激动人心的消息来了——Llama3.1 已经在 Amazon Be...

AIGC 2024-08-21 人工智能

963阅读

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

【新智元导读】AI掌握自我设计的权力，将会怎样?最近，来自UBC等机构研究人员提出了「智能体自动化设计」系统，让元智能体使用搜索算法，自动构建强大的同类。 AI训AI已经老生常谈了，那么，AI能够设计出更强的AI吗? 这不，来自UBC等机构的研究人员提出了...

人工智能 2024-08-20 人工智能

951阅读

Meta发布Llama 3.1 405B模型：开源与闭源模型之争的新篇章

引言在人工智能领域，开源与闭源模型之争一直是热点话题。近日，Meta发布了最新的Llama 3.1 405B模型，以其强大的性能和庞大的参数规模，成为了开源模型中的佼佼者。本文将详细介绍Llama 3.1 405B模型的性能、功能及其在开源领域的影响...

大数据 2024-08-05 人工智能

889阅读

B站AI课几秒出总结，划词就给解释，这个「AI学习搭子」真香

在 ChatGPT 走红之后，本着「打不过就加入」的心态，很多职场人学起了 AI。但遗憾的是，不少人走了弯路，甚至还被某些「199」的课程割了韭菜。其实，学 AI 这事儿并不难。读文章、看视频、啃论文都是很好的学习方式。当然，还是有不少读者吐槽，学 A...

AIGC 2024-07-26 人工智能

1232阅读

海淀家长疯抢的AI神器，有人用它高考前60天提分100+？星火4.0打造最强AI学习机

【新智元导读】如何才是一台能真正帮到孩子的AI学习机?最近，搭载了星火4.0大模型，并全面升级AI1v1答疑辅导实现了超拟人对话的讯飞AI学习机，堪称最省爸妈的AI神器。就在上周，2023年度国家科学技术大奖公布，科大讯飞作为第一单位荣获国家科学技术进步...

AIGC 2024-07-03 人工智能

1118阅读

我用ChatGPT做了一下姜萍的数学竞赛题，它懵了，我也懵了。

不仅仅因为她进入了2024阿里巴巴全球数学竞赛决赛入围名单，而且，因为她是17岁、93分、全球第12名。且是前三十名里唯一的女生。更炸的一点是，是她的学校。江苏省涟水中等专业学校。嗯，中专。她的上下左右，是北大、剑桥、清华、MIT、中科院等等等等...

生成式AI 2024-06-19 人工智能

780阅读

一键 input 苹果 OpenELM，零门槛 Llama 3 教程，40+ 优质模型/数据集/教程，建议收藏！...

现在 AI 行业什么最火？「大模型」一定仍然排在前三甲的位置。自从 2022 年底 ChatGPT 面世以来，大模型在各行各业已经带来了太多的惊喜，应用场景愈发丰富，同时也带动了相关底层技术的普及与普适化。尤其是在开源模型繁荣发展之下，无...

人工智能 2024-06-02 人工智能

1026阅读

当前都在堆长窗口，还需要 RAG 吗？

自从谷歌的 Gemini 1.5 Pro 发布后，行业内就有不少人在背后“蛐蛐” RAG。一方面是因为，Gemini 的表现确实亮眼。根据官方发布的技术报告，Gemini 1.5 Pro 能够稳定处理高达100 token，相当于1小时的视频、11小时...

人工智能 2024-05-29 人工智能

1081阅读

Meta发布类GPT-4o多模态模型Chameleon

Meta最近发布了一个名为Chameleon的多模态模型，它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族，能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构，使用文本、图像...

人工智能 2024-05-21 人工智能

801阅读

清华权威报告：文心一言4.0多项指标遥遥领先

快科技4月23日消息，由清华大学基础模型研究中心最新发布的2024年3月版《SuperBench大模型综合能力评测报告》中，共涵盖了14个具有海内外影响力的模型。在此次评测中，文心4.0的表现令人瞩目，其性能接近国际顶级模型，且与顶尖模型的差距正在逐步缩...

大数据 2024-04-23 人工智能

813阅读

清华全球大模型报告出炉，文心一言语文数学双料第一

最近，由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型，结果显示：文心一言4.0表现亮眼，与国际...

生成式AI 2024-04-22 人工智能

902阅读

「有效上下文」提升20倍！DeepMind发布ReadAgent框架

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于Transformer的大语言模型（LLM）具有很强的语言理解能力，但LLM一次能够读取的文本量仍然受到极大限制。除了上下文窗口...

生成式AI 2024-04-07 人工智能

859阅读

Mistral 7B 比Llama 2更好的开源大模型（一）

Mistral 7B 简介 Mistral 7B Mistral 7B 是一个 7.3B 参数模型：在所有基准测试中优于 Llama 2 13B 在许多基准测试中优于 Llama 1 34B 接近 CodeLlama 7B 的代码性能，同时...

AIGC 2024-04-01 人工智能

851阅读

零一万物API开放多模态中文图表体验超越GPT-4V

近日，零一万物API正式向开发者开放，其中包含三款强大的模型。首先是Yi-34B-Chat-0205，支持通用聊天、问答、对话、写作和翻译等功能;其次是Yi-34B-Chat-200K，能处理多文档阅读理解和构建超长知识库;最后是Yi-VL-Plus多模态...

生成式AI 2024-03-22 人工智能

797阅读

百度智能云发布ERNIE Speed、Lite、Tiny 3款轻量级大模型

百度智能云近期举办了盛大的千帆产品发布会，会上重点发布了三款轻量级大模型，它们分别是ERNIE Speed、ERNIE Lite以及ERNIE Tiny。相较于那些拥有千亿级别参数的大模型，这些轻量级大模型显著减少了参数量，因此更加便于客户针对特定应用场景...

大数据 2024-03-21 人工智能

1096阅读

零一万物发布新一代AI模型Yi-9B，专为中英双语场景优化

近日，由李开复旗下的AI公司零一万物发布的新一代开源模型Yi-9B引起了业界的广泛关注。该模型是Yi系列中最强的模型，实际参数为8.8B，默认上下文长度为4K tokens。 Yi-9B在处理代码编写和数学问题解答方面表现出色，适合技术和学术领域的应用。这...

生成式AI 2024-03-07 人工智能

747阅读

端侧最强，Meta田渊栋等人卷10亿以下参数小模型，LeCun：小技巧启动

「在移动设备上运行 LLM？可能需要 Meta 的一些技巧。」刚刚，图灵奖得主 Yann LeCun 在个人社交平台表示。他所宣传的这项研究来自 Meta 最新论文《 MobileLLM: Optimizing Sub-billion Paramet...

大数据 2024-02-27 人工智能

806阅读

AIGC是什么？GPT-4.0、DALL·E以及Midjourney等多种智能服务

AIGC（人工智能生成内容，Artificial Intelligence Generated Content）是指利用人工智能技术自动生成的文本、图像、音频和视频等内容。随着技术的进步，AIGC已经成为创意产业和内容创作领域的一股新兴力量。MidTool...

生成式AI 2024-02-21 人工智能

949阅读

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

AI2最新发布的开放语言模型（OLMo）框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码，AI2致力于让学术界和研究人员能够共同研究语言模型的科学，探索新的预训练数据子集对下游性能的影响，以...

大数据 2024-02-02 人工智能

804阅读

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

随着 LLaMA、Mistral 等大语言模型的成功，各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂，且新旧模型之间可能存在能力的冗余。近日，中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM，用...

生成式AI 2024-01-29 人工智能

819阅读

一个开源的大型语言模型LLaMA论文简单解读，LLaMA: Open and Efficient Foundation Language Models

一个开源的大型语言模型LLaMA论文解读，LLaMA: Open and Efficient Foundation Language Models 返回论文和资料目录 1.导读 LLaMA 是 Meta AI 发布的包含 7...

生成式AI 2024-01-23 人工智能

982阅读

书生·浦语2.0体验入口 AI聊天InternLM2模型在线使用地址

「InternLM2」书生·浦语2.0是一款面向中文和英文的大型多语言预训练语言模型，标志着自然语言处理技术的新时代。它不仅在语言理解和生成方面有着出色的表现，还能够进行多模式推理和代码理解。这种基于Transformer架构的模型通过海量数据的预训练，在...

AIGC 2024-01-17 人工智能

979阅读

元象开源大模型XVERSE-Long-256K 支持输入25万汉字

元象发布了全球首个上下文窗口长度为256K 的开源大模型 XVERSE-Long-256K，支持输入25万汉字，无条件免费商用。该模型填补了开源生态空白，与元象之前的大模型组成了高性能全家桶。XVERSE-Long-256K 在评测中表现出色，超越了其他...

大数据 2024-01-16 人工智能

1044阅读

Mistral AI推出Mixtral 8x7B：一种改变机器学习的SMoE语言模型效果堪比GPT-3.5

## 划重点: 1. ? **创新模型介绍:** Mistral AI 的研究团队推出了基于 Sparse Mixture of Experts（SMoE）模型的 Mixtral8x7B 语言模型，采用开放权重。 2. ? **性能突出:** Mixtra...

人工智能 2024-01-15 人工智能

1041阅读

最强开源大模型？Llama 2论文解读

标题简介模型预训练预训练设置硬件资源与碳排放模型评估模型微调有监督微调基于人工反馈的强化学习（RLHF）人类偏好数据的收集奖励模型迭代微调过程多轮对话控制 RLHF 结果模型回答的安全性一直...

生成式AI 2024-01-03 人工智能

1298阅读

LLaMA 简介：一个具有 650 亿参数的基础大型语言模型官网介绍

2023 年 2 月 24 日更新：我们刚刚推出了Llama 2 - 有关最新信息的更多信息，请参阅我们关于 Llama 2 的博客文章。作为 Meta 致力于开放科学的一部分，今天我们公开发布 LL...

人工智能 2023-12-25 人工智能

1243阅读

港联证券|万亿级AIGC赛道或迎有序监管

近段时间，连续有国内外科技巨子涌入万亿级AIGC（生成式AI）赛道，A股商场上AIGC、ChatGPT等人工智能相关概念也是继续火热。但与此同时，安全隐患也如冰山一角逐渐露出。多国政府正在考虑加强对其监管，AIGC在全球范围内正在进入强监管时代。在强监管之...

人工智能 2023-12-24 人工智能

768阅读

【LLM】LLaMA简介：一个650亿参数的基础大型语言模型

LLaMA简介：一个650亿参数的基础大型语言模型 Paper Setup 其他资料作为 Meta 对开放科学承诺的一部分，今天我们将公开发布 LLaMA (大型语言模型 Meta AI ，这是一个最先进的大型语言基础模型，旨在帮...

AIGC 2023-12-23 人工智能

1217阅读

通义千问72B模型登顶Hugging Face开源大模型预训练模型榜首

开源大模型社区Hugging Face公布了最新的开源大模型排行榜，通义千问在预训练模型类别中脱颖而出，占据榜首位置。 Hugging Face开源大模型排行榜涵盖了全球上百个顶尖的开源大模型，并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面...

AIGC 2023-12-11 人工智能

850阅读

Github Copilot Chat的规则泄露，详细分析这31条规则

GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它是一种基于机器学习的代码自动完成工具，旨在帮助开发人员更高效地编写代码。 GitHub Copilot Chat是GitHub Copilot的一部分，...

大数据 2023-12-06 人工智能

856阅读

Smart Copilot：大模型在技术服务和智能客服领域提效的最佳实践

欢迎来到魔法宝库，传递AIGC的前沿知识，做有格调的分享❗ 喜欢的话记得点个关注吧！随着云计算技术的快速发展，越来越多的企业和个人选择将业务迁移到云端。有很多云厂商为客户提供了灵活、可扩展的计算资源和服务，使得客户能够更加专注于核心业务。然而，...

生成式AI 2023-12-01 人工智能

1063阅读

Xmind Copilot 和 iThinkAir 的AI功能比较

昨晚刚获得Xmind Copilot的使用资格，很高兴地试了试，同时和之前用的iThinkAir的AI功能做个比较。 Xmind Copilot的AI功能主要有几个： One-liner：一句话生成思维导图注册登录后，界面上就只有一个类似搜索框的输...

大数据 2023-11-28 人工智能

954阅读

Meta 推出的 LLaMA 大语言模型部署教程

Facebo推出的LLaMA模型简介： LLaMA（Lager Language Model From Meta），这是一个从7B到65B参数的基础语言模型的集合。它在数万亿的文本tokens上训练的模型，并表明在不求助于专有和不可访问的数据集，而仅...

大数据 2023-11-12 人工智能

1218阅读

实测文心一言4.0，真的比GPT-4毫不逊色吗？

10月17日，李彦宏在百度世界2023上表示。当天，李彦宏以《手把手教你做AI原生应用》为主题发表演讲，发布文心大模型4.0版本。今天，咱们就开门见山啊。这一回要测一测，昨天才发布的文心一言大模型 4.0。之所以要测它，是因为李彦宏昨天在会上说的那...

AIGC 2023-11-08 人工智能

825阅读

阿里云通义千问2.0正式升级发布参数规模达千亿

在2023年的云栖大会上，阿里云首席技术官周靖人宣布了阿里大模型家族的全面升级发布，通义千问2.0正式升级发布。据介绍，通义千问2.0模型的参数规模达到了千亿级别，无论是在阅读理解、逻辑思维还是数据处理等方面，都实现了大幅度提升，达到了国际先进水平。...

AIGC 2023-10-31 人工智能

1323阅读