大语言模型第3页

大模型行业，根本没有什么“真”开源？

最近一段时间开源大模型市场非常热闹，先是苹果开源了 70 亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large2 相继开源，在多项基准测试中Llama 3. 1 超过了闭源SOTA模型。不过开源派和闭源派之间的争...

人工智能 2024-08-01 人工智能

883阅读

Meta发布Llama 3.1开源大语言模型；谷歌发布NeuralGCM AI天气预测模型

? AI新闻 ? Meta发布Llama 3.1开源大语言模型摘要：Meta正式发布了开源大语言模型Llama 3.1，包括8B、70B和405B参数版本。Llama 3.1在推理能力和多语言支持方面有所改进，上下文长度提升至128K，405B参...

生成式AI 2024-07-30 人工智能

1129阅读

阿里大模型元老杨红霞去向官宣：入职香港高校！被曝创业项目也在推进

最新消息，阿里大模型元老杨红霞入职香港理工大学，任电子计算机系教授。杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员，并在雅虎担任首席科学家。2016年加入阿里巴巴，就职于达摩院智能计算实验室;2023年3月入职字节跳动。她在...

人工智能 2024-07-29 人工智能

980阅读

AI大模型原理（通俗易懂版）——AIGC

传送门：AI大模型原理（通俗易懂版）-CSDN博客 AIGC 说起近期的热门科技词汇，AIGC当之无愧位列其中。从某一天开始，我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。这些AI生...

人工智能 2024-07-29 人工智能

1556阅读

AIGC学习笔记—LLM（前言）

大语言模型本身我不是很了解，但是掌握一些基础的知识点，由于要准备某个公司的二面，所以浅学一下这个技术，也是边摸索边学习...... 首先，我先简单的解释一下大模型，大模型是指具有大规模参数和复杂计算结构的机器学习模型，通常由深度神经网络构建而成，拥有数十...

生成式AI 2024-07-28 人工智能

928阅读

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了机器之心 2024年07月19日 12:27 辽宁 AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了200...

AIGC 2024-07-27 人工智能

1024阅读

一些好用的免费的开源大模型推荐，豆包，文心一言，kimi，poe，通义千问等，对科研党极其友好

今天给大家分享一些我使用过的自认为比较好用的大模型，可以和chatGPT媲美，有需要的可以试试看: 1.豆包 https://www.doubao.com/chat/ 豆包是由字节跳动公司开发的一款人工智能产品。它基于云雀大模型构建，为用户提供网页版...

人工智能 2024-07-26 人工智能

3229阅读

消息称OpenAI今年亏损或高达50亿美元

7月26日消息，据媒体报道，2024年OpenAI年亏损可能高达50亿美元。今年6月，OpenAI CEO奥尔特曼在内部员工会议上透露，今年绝大部分收入预计来自OpenAI的产品和服务，包括ChatGPT的订阅费以及让软件开发人员通过应用程序编程接口（A...

AIGC 2024-07-26 人工智能

919阅读

最强模型 Llama 3.1 如期而至！扎克伯格最新访谈：Llama 会成为 AI 界的 Linux

这是开源 AI 的里程碑时刻。文 | 王启隆出品丨AI 科技大本营（ID：rgznai100）本文为 CSDN 编辑整理，未经授权，禁止转载。今天，Meta AI 的最新最强模型 —— Llama 3.1 如期而至。不仅...

大数据 2024-07-26 人工智能

1133阅读

测试：ollama加载羊驼版本llama-3中文大模型

找了一个晚上各种模型，像极了当初找各种操作系统的镜像，雨林木风，深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文，而且回复的很慢，所以我是在ollama上搜索"chinese"找到了这个羊驼版本的， ollama run lgkt/llama3-...

生成式AI 2024-07-26 人工智能

1084阅读

百度、谷歌之后：微软也要在Bing搜索结果中加入AI摘要

快科技7月25日消息，据媒体报道，继百度、谷歌之后，微软也将在其搜索引擎Bing的搜索结果中引入AI摘要功能。 Bing生成搜索功能目前处于预览阶段，它通过AI技术为用户提供搜索查询的首选结果，并以原始响应的形式呈现。这些响应不仅包括简洁的答案概述，还通...

人工智能 2024-07-25 人工智能

863阅读

2024-06-21 问AI: 在大语言模型中，什么是LLama Index

文心一言 LLama Index是一个针对基于LLM（大型语言模型）的应用程序的数据框架，旨在提供RAG（检索增强生成，Retrieval-Augmented Generation）能力。以下是关于LLama Index的清晰概述：定义与功能：...

AIGC 2024-07-23 人工智能

1314阅读

视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读

本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...

大数据 2024-07-22 人工智能

1072阅读

AI日报：微软推设计神器Microsoft Designer；苹果开源小模型 DCLM-Baseline-7B；小爱宣布新增AI文档问答等功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、微软推设计神器Microsof...

AIGC 2024-07-22 人工智能

1003阅读

[机器学习]-如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境

如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境 1. 问题与需求近段时间想学习一下大语言模型的本地化部署与应用。首先遇到的就是部署硬件环境的问题。我自己的笔记本是一台 MacBook Pro M3，没有 Nv...

AIGC 2024-07-21 人工智能

1389阅读

WPS辟谣用户文档被用作训练抖音豆包AI：完全失实严格遵守个人信息保护法规

快科技7月21日消息，日前，有网友发帖称，WPS疑似把我的审签内容喂给抖音豆包AI”，因为他的审签大纲细纲都是在WPS写的，上传了云空间。今天下午，WPS客户服务官微对此事进行了辟谣，称近日有部分用户反馈WPS AI相关问题，我们第一时间进行了严格排...

AIGC 2024-07-21 人工智能

917阅读

专访诺奖得主：大模型是记忆还是理解？

物理学家理查德·费曼曾将自然世界比作众神的游戏，比如国际象棋——我们不知道游戏规则，但却可以观察棋盘，也许只是其中的一角，然后根据这些观察，试图找出游戏规则。费曼的比喻，道出了科学研究的核心，也生动描绘了许多经济学家的工作，他们同样致力于从纷繁复杂的经济...

AIGC 2024-07-21 人工智能

963阅读

快速上手文心一言进行知识问答、文本创作、知识推理、数学计算、代码理解与编写、作画、翻译等多种任务

本人详解作者：王文峰，参加过 CSDN 2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务...

AIGC 2024-07-21 人工智能

956阅读

给｢大模型初学者｣的 LLaMA 3 核心技术剖析

编者按：本文旨在带领读者深入了解 LLaMA 3 的核心技术 —— 使用 RMSNorm 进行预归一化、SwiGLU 激活函数、旋转编码（RoPE）和字节对编码（BPE）算法。RMSNorm 技术让模型能够识别文本中的重点，SwiGLU 激活函数则如同“...

生成式AI 2024-07-21 人工智能

1257阅读

GPT-4o mini一手测评：懂得不多，但答得极快

昨晚，OpenAI 突然上线新模型 GPT-4o mini，声称要全面取代 GPT-3.5Turbo。在性能方面，GPT-4o mini 在 MMLU 上的得分为82%，在 LMSYS 排行榜的聊天方面分数优于 GPT-4。在价格方面，GPT-4o...

生成式AI 2024-07-20 人工智能

1435阅读

LLaMA-Factory：开源的低代码大模型训练框架

LLaMA-Factory 是一个由零隙智能（SeamLessAI）开源的低代码大模型训练框架，它集成了业界最广泛使用的微调方法和优化技术，并支持众多开源模型的微调和二次训练。一、功能特点支持多种开源模型：LLaMA-Factory支持包括...

大数据 2024-07-20 人工智能

2416阅读

Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决

文章目录 Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决描述错误描述：找不到模块imageio.v3 解决：参考地址其他文章推荐：专栏：人工智能基础知识点专栏：大语言模型LL...

生成式AI 2024-07-18 人工智能

1353阅读

麦当劳决定炒掉AI员工，用AI点餐这件事不靠谱

从游戏公司的画师到电销公司的客服，被AI影响到工作的人在2023年可谓是一茬接着一茬，甚至“第一批因AI而失业的人出现”更是成为了去年部分媒体最有兴趣的话题。事实上，AI技术的快速发展确实已经开始对人类社会造成影响，但过高估计当下AI的能力也大可不必，因为...

大数据 2024-07-17 人工智能

925阅读

“全网最全”LLM推理框架集结营 - 看似微不足道，却决定着AIGC项目的成本、效率与性能!

00-前序随着ChatGPT、GPT-4等大语言模型的出现，彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现，这些大语言模型有一部分是开源的，有一部分是闭源的。伴随着大语言模型的出现，国内外基于大语言模型...

大数据 2024-07-17 人工智能

2334阅读

国产AI大模型Kolors：ComfyUI平台部署指南

在AI技术的浪潮中，快手公司推出的文生图大模型——Kolors，以其卓越的性能和开源精神，成为国产AI技术的一颗璀璨新星。Kolors不仅在图像生成效果上超越了现有的开源模型，更达到了与商业闭源模型相媲美的水平，迅速在社交媒体上引发热议。 Kolors的...

生成式AI 2024-07-16 人工智能

1320阅读

文心一言、Kimi等4款AI大模型测评对比及推荐（AI大模型训练）

现在，国内已经有海量大模型诞生，那么，哪款大模型的表现会更好？这篇文章里，作者站在自媒体人的角度，对四款大模型做了评估和对比，一起来看一下。说到AI，很多人会想到ChatGPT，而我们现在也有许多好用的国产AI大模型。在2023年的中国，8个月...

大数据 2024-07-15 人工智能

1967阅读

LLama Factory微调模型全流程，与peft库调用训练的adapter

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 LLama Factory微调流程一、准备微调的数据集和模型二、读取模型和数据进行训练 1.使用web ui 2.修改官方脚本（推荐）第三，加载与推...

人工智能 2024-07-15 人工智能

1366阅读

Llama 3 基于知识库应用实践（一）

一、概述 Llama 3 是Meta最新推出的开源大语言模型，其8B和13B参数的模型的性能与之前的Llama 2相比实现了质的飞跃。以下是官方给出的模型性能评测对比结果（引自：https://ai.meta.com/blog/meta-llama-3/...

生成式AI 2024-07-14 人工智能

918阅读

近屿OJAC带你解读：AIGC核心知识点LLM

近年来，人工智能（AI）领域经历了令人瞩目的增长，尤其是自然语言处理（NLP）。你知道是什么推动了NLP领域的这种飞速发展吗？没错，那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式！这些模型是如何工作的呢？它们为何如此流行？在本文中...

生成式AI 2024-07-14 人工智能

885阅读

百度智能云升级：接入33个大模型，Llama 2引领创新，103个Prompt模板上线

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业...

生成式AI 2024-07-14 人工智能

903阅读

聚观早报 | 理想L6正式发布；Meta发布Llama 3

聚观早报每日整理最值得关注的行业重点事件，帮助大家及时了解最新行业动态，每日读报，就读聚观365资讯简报。整理丨Cutie 4月20日消息理想L6正式发布 Meta发布Llama 3 比亚迪秦L内饰曝光小米14 Ultra推送新版澎湃...

人工智能 2024-07-13 人工智能

815阅读

谁才是大模型“四小龙”？

这两年热闹的大模型创业潮，被业内称为“AI2.0”。与之对应的“AI1.0”，指的是2015年左右开始的那一波AI创业潮，当时诞生了商汤、旷视、云从、依图等明星创业公司，它们以CV技术（计算机视觉）为主导，大量融资，风头无两。这四家公司，是公认的“AI四...

大数据 2024-07-12 人工智能

893阅读

在stable diffusion中如何分辨lora、大模型、controlnet

LoRA (LowRank Adaptation Stable Diffusion LoRA 是微软的研究人员为了解决大语言模型微调而开发的一项技术,它是一个多模态语言-图像模型，LORA 可以学习将其语言表征迁移到图像 modal 中从而获得跨模态...

人工智能 2024-07-11 人工智能

972阅读

操作系统智能助手OS Copilot评测报告

背景如果不是朋友告知，我还不知道阿里云推出了【操作系统智能助手OS Copilot】这样一款产品。我做系统运维的工作还是挺多的，知道系统运维工作的一些痛点；例如： Linux命令繁杂，想全部记住不太可能，多数运维工程师都是只记住了常用命令，非常...

人工智能 2024-07-11 人工智能

1140阅读

实现 LLM 应用的可观测，难在哪里？

随着生成式 AI 概念的火爆，以 ChatGPT、通义大模型为代表，市场上涌现了一系列商用或者开源的大模型，同时基于大语言模型（LLM ）以及 AI 生态技术栈构建的应用以及业务场景也越来越多。众所周知，LLM 包含数十亿甚至万亿级别的参数，其架构复杂...

人工智能 2024-07-11 人工智能

1123阅读

【AIGC半月报】AIGC大模型启元：2024.06（下）

AIGC大模型启元：2024.06（下） (1 Gen-3 (2 Open-Sora 1.2（Open-Sora再升级） (3 Claude 3.5 Sonnet（Claude升级） (4 ChatTTS v3（ChatTTS升级） (...

AIGC 2024-07-11 人工智能

949阅读

AI自学超越人工标注训练，蚂蚁数科2篇自监督学习论文入选国际顶会

近日，蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议（ECCV）”和“国际机器学习大会(ICML ”，可实现无需人工打标数据的情况下，通过自监督学习、强化学习等方法训练模型输出可信结果。据悉，两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域...

AIGC 2024-07-11 人工智能

963阅读

《AI聊天类工具之五——Copilot》

一.简介官网：Microsoft Copilot: 你的日常 AI 助手 Copilot是微软在Windows 11操作系统中引入的一款先进的AI助手。这款工具集成在操作系统的侧边栏中，旨在帮助用户完成各种任务。它依托于底层大语言模型（LLM），...

大数据 2024-07-11 人工智能

1149阅读

大模型真的在吞噬人类的一切数据吗？

在弗兰克·赫伯特的《沙丘》中，沙漠星球厄拉科斯的沙丘下隐藏着一种无价之宝:香料。这种神秘物质使太空旅行成为可能，能延长寿命，并具有扩展意识的效果，是宇宙中最宝贵的财富。“谁控制了香料，谁就控制了宇宙”。正如香料在《沙丘》宇宙中占据着至关重要的地位一样，在...

AIGC 2024-07-11 人工智能

896阅读

AIGC革新浪潮：大语言模型如何优化企业运营

在当今快速发展的商业环境中，企业对于有效管理知识资产的需求日益增长。知识管理作为企业核心竞争力的关键组成部分，对于提高决策质量、增强创新能力和优化运营流程起着至关重要的作用。随着数字化转型的推进，企业对知识管理系统提出了新的要求，期望其能够更加智能化、高效...

人工智能 2024-07-10 人工智能

992阅读

Meta Llama 3 来啦！性能算力究竟如何？

新一代大语言模型 Meta Llama 3 横空出世！前言就在4月19日，Meta公司推出了他们最新开源的大型语言模型(LLM Llama 3！这次的Llama 3包含了8B和70B两种不同参数规模的模型。那么作为Llama的第三代模型它...

大数据 2024-07-09 人工智能

893阅读

RAG微调Llama 3竟超越GPT-4！英伟达GaTech华人学者提出RankRAG框架

【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流水线，用微调的方法交给同一个LLM完成，结果同时实现了模型在RAG任务上的性能提升。在需要大量事实知识的文本生成任务中，R...

AIGC 2024-07-09 人工智能

1436阅读

【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3

?博客主页：西瓜WiFi ?系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！如果觉得有用，请三连?⭐❤️，谢谢！长期不定时更新，欢迎watch和fork！❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...

大数据 2024-07-08 人工智能

860阅读

如何快速接入llama 3 ？送上最便捷教程

一、Meta llama 3介绍当地时间4月18日，Meta 发布两款开源Llama 3 8B与Llama 3 70B模型。按照Meta的说法，Llama 3 8B和Llama 3 70B是目前同体量下，性能最好的开源模型。在Llama...

大数据 2024-07-08 人工智能

979阅读

理财AI勇闯「无人区」：理解专家、成为专家

用十年时间成为全球在线服务数亿用户的财富管理平台后，摆在蚂蚁财富面前的是一段少有人走过的路: 这5亿活跃用户第一次动动手就能接触到各类普惠的理财产品，但真正理财行为成熟的仅占两成。而放眼中国7.2亿基金投资者里，每3600人才能分到1位传统理财顾问来服务。...

AIGC 2024-07-08 人工智能

927阅读

大语言模型的底层原理，ChatGPT，文心一言等人工智能体是如何产生的？本文将详细讲解

文章目录基础介绍一、预训练 1.数据准备质量过滤敏感内容过滤数据去重数据预处理实践质量过滤去重隐私过滤 2.词元化 BPE 分词 WordPiece 分词 Unigram 分词 3.数据调度总结参考文献...

AIGC 2024-07-08 人工智能

1325阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1788阅读

【AIGC】LangChain入门指南—第二章 LangChain入门指南

第二章 LangChain入门指南文章目录第二章 LangChain入门指南前言一、主要内容 1、初识LangChain 1.1 为什么需要LangChain 1.2 LLM应用开发的最后1公里 1.3 LangChain的...

人工智能 2024-07-06 人工智能

1723阅读

百度李彦宏称AI跑分刷榜乱象不止：今天震撼发布、明天史诗级更新

快科技7月5日消息，在2024年世界人工智能大会上，百度创始人李彦宏发表了演讲，认为业界过分关注模型的评测分数和规模，而忽视了AI技术真正的价值应用。李彦宏指出，当前AI领域存在一种不良风气，即各个公司竞相发布新一代大语言模型，宣称自己的模型参数规模和训...

AIGC 2024-07-05 人工智能

880阅读

全员i人？《大闹天宫》MBTI测试让全公司炸锅！最神秘国产大模型团队出手了

【新智元导读】最近，公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问，让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风，简直让人一秒穿越回童年。就在最近，全公司都为这个大闹天宫MBTI测...

生成式AI 2024-07-04 人工智能

788阅读