训练数据集第2页

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。最近，AI 大牛 Andrej Karpa...

AIGC 2024-06-04 人工智能

821阅读

ChatGPT真能记住你的话吗？DeepMind与开源大佬揭示LLM记忆之谜

Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章，核心观点是——虽然很多LLM看起来有记忆，但本质上是无状态函数。文章地址：https://simonwillison.net/2024/May/29/trai...

人工智能 2024-06-04 人工智能

872阅读

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。 Scaling law 告诉我们：只要能适当地分配参数和数据，就能在固定计算预算下实...

大数据 2024-06-03 人工智能

861阅读

大型科技公司拥才有承担 AI 训练数据成本的能力

AI 的发展离不开数据，而这种数据的成本越来越高，这使得除了最富有的科技公司外，其他公司难以承担这一成本。根据去年 OpenAI 的研究人员 James Betker 的文章，AI 模型的训练数据是决定模型能力的关键因素。传统的 AI 系统主要是基于统计机...

人工智能 2024-06-03 人工智能

900阅读

【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么

LLaVA++能够为Phi-3和Llama-3带来的主要好处包括：视觉处理能力的增强：通过整合Phi-3和Llama-3模型，创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本，这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...

生成式AI 2024-06-03 人工智能

1116阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 3

LLaMA 3 2024年4月18日，Meta 重磅推出了Meta Llama 3，Llama 3是Meta最先进开源大型语言模型的下一代，包括具有80亿和700亿参数的预训练和指令微调的语言模型，能够支持广泛的应用场景。这一代Llama在一系列行业标...

AIGC 2024-05-31 人工智能

1592阅读

简单几步微调Llama 3大模型，小白轻松上手

这是面向小白用户的一个超级简单的微调大模型示例，通过这个例子将得到一个速度翻倍，并可以包含自己业务知识数据的微调后llama3模型，可用于本地部署构建私有化的AI智能体。very 的 nice 首先请准备好google账号和网络环境，这个示例基于gool...

人工智能 2024-05-30 人工智能

1176阅读

AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘—— 不仅能识别DNA、RNA与相应蛋白质之间的内在联系，在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。模型名为LucaOne，由阿里云...

人工智能 2024-05-30 人工智能

907阅读

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

高质量图像编辑的方法有很多，但都很难准确表达出真实的物理世界。那么，Edit the World试试。图片来自北京大学、Tiamat AI、天工AI、Mila实验室提出了EditWorld，他们引入了一种新的编辑任务，即世界指令（world-ins...

大数据 2024-05-30 人工智能

823阅读

数据驱动与 LLM 微调：打造 E2E 任务型对话 Agent

作者 | Thought Agent 社区在对话系统的设计和实现中，传统的基于 Rasa-like 框架的方法往往需要依赖于多个模块的紧密协作，例如我们在之前的文章中提到的基于大模型（LLM）构建的任务型对话 Agent，Thought Agent，其...

生成式AI 2024-05-29 人工智能

1203阅读

Meta被曝使用Instagram等照片训练AI模型引发隐私争议

全球社交巨头 Meta 最近因使用用户照片训练 AI 模型 Emu 引发了一场隐私争议。据报道，Meta 正在利用 Instagram 和 Facebook 上的用户照片进行训练，同时还会使用用户对图片的描述、标题等文本数据。这严重违反了数据隐私搜集条例，...

大数据 2024-05-28 人工智能

904阅读

用于精确目标检测的多网格冗余边界框标注

本文经计算机视觉研究院公众号授权转载，转载请联系出处。一、前言现在领先的目标检测器是从基于深度CNN的主干分类器网络重新调整用途的两级或单级网络。YOLOv3就是这样一种众所周知的最先进的单级检测器，它接收输入图像并将其划分为大小相等的网格矩阵。具...

人工智能 2024-05-28 人工智能

807阅读

Copilot Workspace是GitHub对人工智能驱动的软件工程的诠释

软件开发的未来是人工智能驱动的集成开发环境吗？至少GitHub 是这样想的。在今年初秋于旧金山举行的 GitHub Universe 年度大会之前，GitHub 发布了 Copilot Workspace，这是一种开发环境，利用 GitHub 所称的...

大数据 2024-05-26 人工智能

879阅读

autodl 上使用 LLaMA-Factory 微调中文版 llama3

autodl 上使用 LLaMA-Factory 微调中文版 llama3 环境准备创建虚拟环境下载微调工具 LLaMA-Factory 下载 llama3-8B 开始微调测试微调结果模型合并后导出 vllm 加速推理...

人工智能 2024-05-26 人工智能

1684阅读

Llama 3 开源！手把手带你进行大模型推理，部署，微调和评估

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。基于大模型实践和技术交流，我...

AIGC 2024-05-25 人工智能

1215阅读

AIGC实战——基于Transformer实现音乐生成

AIGC实战——基于Transformer实现音乐生成 0. 前言 1. 音乐生成的挑战 2. MuseNet 3. 音乐数据 3.1 巴赫大提琴组曲数据集 3.2 解析 MI...

人工智能 2024-05-24 人工智能

820阅读

微软发布Phi-3 Vision等最新大模型系列

微软发布了其最新的大型语言模型系列，Phi-3，包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美，同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...

AIGC 2024-05-22 人工智能

794阅读

拯救被「掰弯」的GPT-4！西交微软北大联合提出IN2训练治疗LLM「中间迷失」

【新智元导读】近日，西交微软北大联合提出信息密集型训练大法，使用纯数据驱动的方式，矫正LLM训练过程产生的偏见，在一定程度上治疗了大语言模型丢失中间信息的问题。辛辛苦苦给大语言模型输入了一大堆提示，它却只记住了开头和结尾? 这个现象叫做LLM的中间迷失（...

生成式AI 2024-05-22 人工智能

902阅读

案例分享｜Alluxio在自动驾驶模型训练中的应用与部署

分享嘉宾：杨林三-辉羲智能关于辉羲智能：辉羲智能是一家做自动驾驶芯片的初创公司，成立于2022年。致力打造创新车载智能计算平台，提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案，助力车企实现优质高效的自动驾驶量产交付，构建低成本、大规...

生成式AI 2024-05-21 人工智能

836阅读

蚂蚁多模态团队在视频多模态方向的技术探索

一、概述视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向，一个是视频-文本的语义检索，另外一个是视频-视频的同源检索。视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频，其检索文本未必在检索到的视频描述中直接出现，但检...

大数据 2024-05-21 人工智能

897阅读

西浦、利物浦大学提出：点云数据增强首个全面综述

本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士，其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...

生成式AI 2024-05-14 人工智能

959阅读

探索生成式人工智能的版权清算问题

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 法院正在探讨并决定生成式人工智能是否侵犯版权。本文中，让我们来谈谈这到底意味着什么。美国的版权法是一件复杂的事情。我们这些不是律师的...

大数据 2024-05-09 人工智能

853阅读

据报道，微软正在开发拥有5000亿个参数的MAI-1人工智能模型

据The Information近日报道，微软公司正在开发一个拥有约5000亿个参数的大型语言模型。据悉，这个在微软内部被称为MAI-1的大型语言模型预计最早将于本月亮相。 OpenAI在2020年中期推出 GPT-3 时，详细说明了该模型的初始版...

大数据 2024-05-08 人工智能

777阅读

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

AI做数学题，真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现，即使不让AI写步骤，全用无意义的“……”代替，在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势，具体选择了什么token无...

生成式AI 2024-05-06 人工智能

766阅读

OpenAI与英国金融时报签署合作协议，为ChatGPT提供许可内容

OpenAI 近日宣布与英国知名新闻日报《金融时报》签署战略合作伙伴关系，旨在扩大 ChatGPT 上可用的新闻内容。根据协议，ChatGPT 将以相应查询方式呈现《金融时报》的文章，并附上必要的摘要、引述和链接。双方在一份新闻稿中指出，所有来自《金融时报...

生成式AI 2024-04-30 人工智能

817阅读

苹果卷开源大模型，公开代码、权重、数据集、训练全过程，OpenELM亮相

要说 ChatGPT 拉开了大模型竞赛的序幕，那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中，苹果似乎掀起的水花不是很大。不过，苹果最新放出的论文，我们看到其在开源领域做出的贡献。近日，苹果发布了 OpenELM，共四种变...

生成式AI 2024-04-25 人工智能

883阅读

微软3.8B模型媲美GPT-3.5！小到用iPhone就能跑起来，网友：Good data is all you need!

撰文、整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）这周，“小模型”之战打得可谓精彩非凡，让人目不暇接。前脚，小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...

AIGC 2024-04-24 人工智能

848阅读

微软推出新型AI工具VASA-1：可将照片转化为视频

快科技4月21日消息，据媒体报道，微软亚洲研究院近期推出了一款革命性的人工智能工具VASA-1，这一工具的推出引起了业界和公众的广泛关注。 VASA-1的独特之处在于，它能够将静态图像或绘画与音频文件结合，生成具有动态面部表情和头部动作的面孔。这意味着，仅...

人工智能 2024-04-21 人工智能

843阅读

引人注意的十大由AI造成的灾难案例

2017年，《经济学人》宣称数据已取代石油成为世界上最有价值的资源，这一说法自此一直被重复。跨越各个行业的企业一直在投资数据和分析，并将持续大举投资，但就像石油一样，数据和分析也有其阴暗面。根据《CIO》杂志2023年的《CIO状态报告》，26%的I...

AIGC 2024-04-21 人工智能

932阅读

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

LLM界的「真·Open AI」，又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型，终于来了!开源模型追上闭源模型的历史性一刻，或许就在眼前了? 一石激起千层浪，Llama3才刚刚发布没几小时，就破纪录地登顶了Hugging Face排行榜。这...

人工智能 2024-04-20 人工智能

938阅读

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

扎克伯格:「有了 Llama3，全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。本周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开源大模型 Llama3。扎克伯格在 Faceboo...

生成式AI 2024-04-20 人工智能

1050阅读

基于因果推断的推荐系统：回顾和前瞻

本次分享的主题为基于因果推断的推荐系统，回顾过去的相关工作，并提出本方向的未来展望。为什么在推荐系统中需要使用因果推断技术？现有的研究工作用因果推断来解决三类问题（参见 Gao et al.的 TOIS 2023 论文 Causal Inference...

人工智能 2024-04-12 人工智能

1117阅读

美国新法案要AI公司透露用于训练AI模型受版权保护的作品

美国国会于周二提出了一项法案，旨在强制人工智能公司透露他们用于训练生成 AI 模型的受版权保护的材料。这项立法进一步加入了立法者、新闻机构和艺术家为了确定 AI 公司如何使用诸如歌曲、视觉艺术、书籍和电影等创作作品来训练他们的软件，并且这些公司是否违法侵犯...

大数据 2024-04-10 人工智能

794阅读

破解36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

【新智元导读】大语言模型的「逆转诅咒」，被解开了。近日，来自Meta FAIR的研究人员推出了反向训练大法，让模型从反方向上学到了事实之间的逻辑，终于改进了这个困扰人们已久的问题。大语言模型的「逆转诅咒」，被解开了! 这个诅咒在去年9月首次被发现，一时间...

人工智能 2024-04-09 人工智能

871阅读

破除36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的「逆转诅咒」，被解开了！这个诅咒在去年9月首次被发现，一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”：一个在「A是B」上训练的语言模型，并不能正确回答出「B是A」。...

人工智能 2024-04-09 人工智能

918阅读

太全了！多模态深度学习的综述！

1.介绍我们对世界的体验是多模态的 —— 我们看到物体，听到声音，感觉到质地，闻到气味，尝到味道。模态是指某件事发生或经历的方式，当一个研究问题包含多个模态时，它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展，它需要能够同时解释这些...

人工智能 2024-04-08 人工智能

1013阅读

10万美元训出Llama-2级大模型！全华人打造新型MoE，贾扬清SD前CEO围观

想了解更多AIGC的内容： https://www.51cto.com/aigc/ “只需”10万美元，训练Llama-2级别的大模型。尺寸更小但性能不减的MoE模型来了：它叫JetMoE，来自MIT、普林斯顿等研究机构。性能妥妥超过同等规模的Ll...

生成式AI 2024-04-07 人工智能

832阅读

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 文本嵌入模型在自然语言处理中扮演着重要角色，为各种文本相关任务提供了强大的语义表示和计算能力。在语义表示上，文本嵌入模型将文本转换为高...

生成式AI 2024-04-07 人工智能

771阅读

[论文笔记]LLaMA: Open and Efficient Foundation Language Models

引言今天带来经典论文 LLaMA: Open and Efficient Foundation Language Models 的笔记，论文标题翻译过来就是 LLaMA:开放和高效的基础语言模型。 LLaMA提供了不可多得的大模型开发思路，为很多国...

AIGC 2024-04-07 人工智能

1457阅读

“真假难辨”！巧用NeRF生成的自动驾驶仿真数据

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解神经辐射场（NeRF）已成为推进自动驾驶（AD）重新搜索的有前途的工具，提供可扩展的闭环模拟和数据增强功能。然而，为了信任模拟中获得的结果，需要确保AD系统以相同的方式...

生成式AI 2024-04-01 人工智能

1028阅读

AI帮写会重复吗？探索智能写作工具的独特性与原创性

大家好，小发猫降重今天来聊聊AI帮写会重复吗？探索智能写作工具的独特性与原创性，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI帮写会重复吗？探索智能写作工具的独特性与原创性随着人工智能...

AIGC 2024-03-29 人工智能

975阅读

MIT研究员推新AI图片生成框架DMD：AI 单步生成高质量图像速度快30倍

在当今人工智能时代，计算机可以通过扩散模型生成自己的 “艺术”，逐步向嘈杂的初始状态添加结构，直到清晰的图像或视频出现。扩散模型突然变得异常受欢迎:输入几个词，即可体验现实与幻想交汇的梦幻景象。在幕后，这涉及一个复杂、耗时的过程，需要算法多次迭代才能完美...

生成式AI 2024-03-22 人工智能

878阅读

华为天才少年谢凌曦：关于视觉识别领域发展的个人观点！

本文经自动驾驶之心公众号授权转载，转载请联系出处。最近，我参加了几个高强度的学术活动，包括CCF计算机视觉专委会的闭门研讨会和VALSE线下大会。经过与其他学者的交流，我产生了许多想法，千头万绪，便希望把它们整理下来，供自己和同行们参考。当然，受限于...

AIGC 2024-03-20 人工智能

778阅读

大模型增速远超摩尔定律！MIT最新研究：人类快要喂不饱AI了

我们人类可能要养不起AI了！近日，来自MIT FutureTech的研究人员发表了一项关于大模型能力增长速度的研究，结果表明：LLM的能力大约每8个月就会翻一倍，速度远超摩尔定律！论文地址：https://arxiv.org/pdf/2403.0...

大数据 2024-03-18 人工智能

842阅读

仅需200M参数，零样本性能超越有监督！谷歌发布时序预测基础模型TimesFM

时间序列预测在零售、金融、制造业、医疗保健和自然科学等各个领域无处不在：比如说在零售场景下中，「提高需求预测准确性」可以有显著降低库存成本并增加收入。深度学习（DL）模型基本上垄断了「多变量时间序列预测」任务，在各个竞赛、现实应用中的表现都非常好。与...

人工智能 2024-03-15 人工智能

1056阅读

刷榜「代码生成」任务！复旦等发布StepCoder框架：从编译器反馈信号中强化学习

大型语言模型（LLMs）的发展极大地推动了代码生成领域的发展，之前有工作将强化学习（RL）与编译器的反馈信号集成在一起，用于探索LLMs的输出空间，以提高代码生成质量。但当下还存在两个问题： 1. 强化学习探索很难直接适配到「复杂的人类需求」，即要求L...

AIGC 2024-03-15 人工智能

1151阅读

首次攻克「图基础模型」三大难题！港大开源OpenGraph：零样本学习适配多种下游任

图学习（Graph Learning）技术能够对复杂的关系数据进行挖掘和学习，在推荐系统、社交网络分析、引用网络和交通网络等多个领域都显示出了巨大的应用价值。图神经网络（Graph Neural Networks, GNNs）基于迭代的消息传递机制，能...

人工智能 2024-03-15 人工智能

907阅读

实时加SOTA一飞冲天！FastOcc：推理更快、部署友好Occ算法来啦！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在自动驾驶系统当中，感知任务是整个自驾系统中至关重要的组成部分。感知任务的主要目标是使自动驾驶车辆能够理解和感知周围的环境元素，如行驶在路上的车辆、路旁的行人、行驶过...

生成式AI 2024-03-14 人工智能

1028阅读

如何使用Nightshade保护艺术品免受生成式AI的侵害

译者 | 陈峻审校 | 重楼如您所见，当前正在发生的这场人工智能（AI）革命已经席卷了各行各业。其中给人最直观的感受便是，在基于交互式人机对话的基础上，AI算法不但可以生成类似人类语言的文本，而且能够根据一个（组）单词创建图像和视频。不过，这些人工智...

人工智能 2024-03-13 人工智能

796阅读

关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答

文章目录关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答先总结一下 Q：LLM模型预训练前与提示词关系，LLM模型预训练后与提示词关系 Q：预训练用的数据集与提示词有什么异同 Q：为什么我看到的数据集结构和提示词结...

人工智能 2024-03-11 人工智能

1013阅读