训练数据集第3页

AI加速引擎PAI-TorchAcc：OLMo训练加速最佳实践

作者：黄奕桐、沈雯婷、艾宝乐、王昂、李永摘要阿里云机器学习平台PAI开发的Pytorch训练加速框架PAI-TorchAcc已接入最新开源的大语言模型 OLMo。在保证模型效果和易用性的前提下，PAI-TorchAcc相对 PyTorch 性能在...

大数据 2024-03-07 人工智能

945阅读

Cohere 与埃森哲合作加速企业 AI 应用

Cohere 很高兴宣布与埃森哲合作，旨在将我们最先进的 Command 和 Embed 模型以及业界领先的检索增强生成（RAG）功能带给企业，助力企业跨部门推广生成式人工智能的应用。这两家公司将联手为企业提供由 Cohere 的旗舰专有生成 LLM 模...

人工智能 2024-03-05 人工智能

870阅读

Beeble AI与纽约大学合作发布创新的人像重照明技术SwitchLight

近日，Beeble AI与纽约大学联手发布了一项新的研究成果，一种创新的人像重照明技术。这项技术能够在非常低的成本下，将人物与虚拟环境的光照完美融合，效果令人印象深刻。论文地址：https://arxiv.org/pdf/2402.18848.pdf...

大数据 2024-03-04 人工智能

856阅读

如何使用小型自动生成的数据集训练编码LLM

译者 | 李睿审校 | 重楼虽然像GPT-4这样的大型语言模型(LLM 在编写软件代码方面非常精通，但是这些模型的成本和不透明性激发了人们对更加经济、规模更小的编码LLM的兴趣。这些替代方案可以针对特定任务进行微调，并且成本很低。开发这些LLM的...

生成式AI 2024-03-01 人工智能

862阅读

使用Rust的Linfa和Polars库进行机器学习：线性回归

在这篇文章中，我们将使用Rust的Linfa库和Polars库来实现机器学习中的线性回归算法。 Linfa crate旨在提供一个全面的工具包来使用Rust构建机器学习应用程序。 Polars是Rust的一个DataFrame库，它基于Apache Ar...

大数据 2024-03-01 人工智能

900阅读

英伟达发布Nemotron-4:150亿参数通用大模型，目标单张A100/H100可跑

英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数，经过在8T token上的训练，在英语、多语言和编码任务中表现出色。具体而言，Nemotron-4在7个评估基准上的15B模型表现优异，超越同等参数规模的模型，甚至击...

人工智能 2024-02-29 人工智能

879阅读

英伟达最强通用大模型Nemotron-4登场！15B击败62B，目标单张A100/H100可跑

最近，英伟达团队推出了全新的模型Nemotron-4，150亿参数，在8T token上完成了训练。值得一提的是，Nemotron-4在英语、多语言和编码任务方面令人印象深刻。论文地址：https://arxiv.org/abs/2402.1681...

AIGC 2024-02-29 人工智能

865阅读

知名AI研究者深挖谷歌Gemma：参数不止70亿，设计原则很独特

就在几天前，开源大模型领域迎来了重磅新玩家：谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini，Gemma 更加轻量，同时保持免费可用，模型权重也一并开源了，且允许商用。谷歌发布了包含两种权重规模的模型：Gemma 2B 和 Gemma...

生成式AI 2024-02-28 人工智能

828阅读

微软推出用于发现AI模型风险的工具PyRIT

微软公司一个负责利用黑客手段发现网络安全问题的团队开源了一个内部工具PyRIT，该工具可以帮助开发人员发现人工智能模型中的风险。研究人员于本周四发布了该框架的代码。微软表示，PyRIT可以自动生成数以千计的对抗性人工智能提示，来测试神经网络能否有效抵...

大数据 2024-02-27 人工智能

822阅读

高质量论文中文翻译：Lag-Llama: 朝向基础模型的概率时间序列预测 Lag-Llama: Towards Foundation Models for Probabilistic Time S

Lag-Llama: 朝向基础模型的概率时间序列预测Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 文章目录摘要介绍我们的贡献...

AIGC 2024-02-27 人工智能

1093阅读

出门问问开放大模型“序列猴子”开源数据集

出门问问宣布，将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集，命名为“序列猴子开源数据集1.0”。序列猴子，作为出门问问的核心技术之一，具备强大的通用表示与推理能力，已在问答系统、自然语言处理、机器翻译、文本摘要等多个领域展现出其卓越的性能，...

大数据 2024-02-26 人工智能

866阅读

补齐Transformer规划短板，田渊栋团队的Searchformer火了

最近几年，基于 Transformer 的架构在多种任务上都表现卓越，吸引了世界的瞩目。使用这类架构搭配大量数据，得到的大型语言模型（LLM）等模型可以很好地泛化用于真实世界用例。尽管有如此成功，但基于 Transformer 的架构和 LLM 依然难...

大数据 2024-02-26 人工智能

821阅读

谷歌Gemini生图功能紧急关闭，口碑一夜塌房，Yann LeCun：我早就知道

去年年底，谷歌 Gemini 震撼了业界，它是谷歌「最大、最有能力和最通用」的 AI 系统，号称第一个原生多模态大模型，能力超越 GPT-4，也被认为是谷歌反击微软和 OpenAI 的强大工具。对此，在 2 月 8 日，谷歌还把自家对标 ChatGPT...

AIGC 2024-02-26 人工智能

804阅读

使用Stable Diffusion完成绘图

2.2 使用Stable Diffusion完成绘图 Stable diffusion 由于其开源特性，发展极为迅猛，可以说很多效果超过了 Midjourney 也完全不过分，知识系统十分庞杂，他是有两个公司运营研发，WebUI和sd的ckpt文件都...

人工智能 2024-02-22 人工智能

1086阅读

都在搞端到端，试问端到端自动驾驶的基石到底是什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基础模型的出现彻底改变了自然语言处理和计算机视觉领域，为其在自动驾驶（AD）中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾，展示了基础模型在增强AD中的...

人工智能 2024-02-22 人工智能

898阅读

详解面向 Java 开发人员的机器学习案例

译者 | 陈峻审校 | 重楼自去年以来，诸如ChatGPT 和 Bard之类的大语言模型已将机器学习提升到了一种现象级的地位。开发人员使用它们在辅助编程方面不断探索了从图像生成到疾病检测等领域的应用案例。鉴于全球各大科技公司都在加大针对机器学习的...

大数据 2024-02-21 人工智能

952阅读

美国商标局确认：OpenAI 无法申请 “GPT” 商标

OpenAI 是一家开发 AI 工具和聊天机器人的公司，但其 ChatGPT 制作者可能无法拥有该技术的商标。美国专利商标局（PTO）拒绝让由 Sam Altman 领导的 OpenAI 公司注册 GPT(生成式预训练转换器作为商标的申请。该公司在与...

AIGC 2024-02-19 人工智能

878阅读

Nomic AI 发布首个完全开源的长文本嵌入模型，超越 OpenAI Ada-002在各项基准测试中的表现

在自然语言处理（NLP）领域不断发展的背景下，理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力，特别是通过文本嵌入的发展。这些嵌入成为许多应用的基础，包括大型语言模型(LLMs 的检索增强生成和语义搜索。它们将句子或文档转换为低维向...

人工智能 2024-02-18 人工智能

1305阅读

使用LlamaIndex和ChatGPT的无代码检索增强生成（RAG）

检索增强生成(RAG 是使用大型语言模型(LLM 的关键工具。RAG使LLM能够将外部文档合并到它们的响应中，从而更紧密地与用户需求保持一致。这个功能在传统上使用LLM犹豫不决的领域尤其有益，尤其是在事实很重要的时候。自从ChatGPT和类似的LLM推...

大数据 2024-02-18 人工智能

1051阅读

训不动Mixtral，要不试试LLaMA-MoE？

深度学习自然语言处理原创作者：cola 随着各种各样增强版LLaMA的出现，Mixture-of-Expert(MoE 类模型越来越受大家关注。而LLaMA-MoE正是基于LLaMA系列和SlimPajama的MoE模型。它显著的一个好处...

人工智能 2024-02-18 人工智能

1102阅读

如何使用TensorFlow和Cleanvision检测大堡礁的海星威胁？

澳大利亚的大堡礁美不胜收，是全球最大的珊瑚礁，也是多种多样的海洋生物栖息的家园。不幸的是，珊瑚礁面临蚕食珊瑚的棘冠海星（COTS）的威胁。为了控制COTS爆发，珊瑚礁管理人员使用一种名为Manta Tow勘查的方法，将潜水员拖在船后，目测评估珊瑚礁的各...

生成式AI 2024-02-17 人工智能

1431阅读

使用deepspeed继续训练LLAMA

目录 1. 数据训练配置 2. 模型载入 3. 优化器设置 4. DeepSpeed 设置 5. DeepSpeed 初始化 6. 模型训练 LLAMA 模型子结构： 1. 数据训练配置利用 PyTorch 和 Transfo...

生成式AI 2024-02-15 人工智能

1142阅读

LLaMA 入门指南

LLaMA 入门指南 LLaMA 入门指南 LLaMA的简介 LLaMA模型的主要结构 Transformer架构多层自注意力层前馈神经网络 Layer Normalization和残差连接 LLaMA模型的变体 Base版本 La...

人工智能 2024-02-15 人工智能

1562阅读

科技部出手！科研人员的 AIGC 使用手册来了，学术界开始防范 AI 枪手

篡改实验数据、实验图片造假、论文不当署名、教材编写抄袭……1 月 16 日下午，华中农业大学的 11 名学生「一纸诉状」，以一份 125 页的举报材料实名举报该校黄姓教授存在学术不端行为。一时间，舆论迅速发酵，「赌上前程捍卫学术清白」、「人人都是学术造假受...

AIGC 2024-02-15 人工智能

838阅读

八项指标对比ChatGPT和文心一言

文章目录前言特定指标对比：实际运用对比：一、算力二、训练时间三、算法复杂度四、模型结构五、应用场景六、性能指标七、可解释性八、迁移能力 ✍创作者：全栈弄潮儿 ? 个人主页：全栈弄潮儿的个人主页 ?️ 个人...

人工智能 2024-02-15 人工智能

965阅读

AIGC内容分享(四十四)：[AIGC服务] 视频生成 | “群魔乱舞“

目录骨架驱动的人形动画生成原理简介应用前景骨架驱动的人形动画生成输入人脸图像+视频动画或者文本描述输出视频...

人工智能 2024-02-11 人工智能

949阅读

AI新工具(20240203) 文心一言APP数字分身；HuggingChat Assistants等

文心一言APP数字分身-一键生成专属数字分身文心一言数字分身是一项新功能，用户只需一张照片和录制三句语音，就能创建一个专属的数字分身。这个数字分身还支持个性化定义名称、声音、MBTI性格等，用户可以选择是否公开自己的数字分身。这个功能的上线大大缩短...

AIGC 2024-02-10 人工智能

1259阅读

详解各种LLM系列｜LLaMA 1 模型架构、预训练、部署优化特点总结

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』，加入 NewBee讨论组 LLaMA 是Meta在2...

生成式AI 2024-02-10 人工智能

1916阅读

llama/llama2论文解读

llama 摘要 llama在约1.4T的token上，训练出参数量7B到65B的模型，其模型规模如下在仅使用开源数据集的情况下，llama-13B在多数benchmarks上与GPT-3效果相当；llama-65B也与最好的模型（Chin...

AIGC 2024-02-09 人工智能

1275阅读

全网最全stable diffusion模型讲解！快来！！小白必收藏！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取） AI模型最新展现出的图像生成能力远远超出人们的预期...

人工智能 2024-02-08 人工智能

1383阅读

Stable Diffusion 基本原理

1 Diffusion Model的运作过程输入一张和我们所需结果图尺寸一致的噪声图像，通过Denoise模块逐步减少noise，最终生成我们需要的效果图。图中Denoise模块虽然是同一个，但是它会根据不同step的输入图像和代表noise严重程...

生成式AI 2024-02-07 人工智能

845阅读

无需RLHF显著提升GPT-4/Llama2性能，北大团队提出Aligner对齐新范式

背景大语言模型（LLMs）虽展现出了强大的能力，但也可能产生不可预测和有害的输出，例如冒犯性回应、虚假信息和泄露隐私数据，给用户和社会造成伤害。确保这些模型的行为与人类意图和价值观相对齐，是一个紧迫的挑战。尽管基于人类反馈的强化学习（RLHF）提供了...

AIGC 2024-02-07 人工智能

899阅读

RMBG-1.4官网体验入口 AI高效准确分割图像前后背景免费在线使用地址

RMBG-1.4是一个用于图像背景去除的Pytorch模型，由BRIA AI开发。经过专业级数据集的训练，能够高效准确地分割前景和背景。该模型的精度、效率和通用性目前可与领先的开源模型媲美，适用于支持企业大规模内容创作的商业使用案例。由于使用了合法许可的训...

人工智能 2024-02-07 人工智能

906阅读

爆火的AI博主，是“摇钱树”还是“坑”？（附实测教程）

这段时间，平均一周就有一位虚拟博主火爆出圈。自此前Instagram博主Emily靠堪称完美的颜值在Ins4周内涨粉超20万之后，最近，外网又有一位叫Lexi Love的AI博主火了。 Lexi Love的Ins账号数据她的角色设定依旧是模特，背后的...

生成式AI 2024-02-05 人工智能

1338阅读

GPT-SoVITS官网体验入口 AI文本生成合成转换语音在线免费使用地址

GPT-SoVITS是一个强大的零样本语音转换和文本到语音WebUI。它具有零样本TTS、少样本TTS、跨语言支持和WebUI工具等功能。该产品支持英语、日语和中文，提供了集成工具，包括语音伴奏分离、自动训练集分割、中文ASR和文本标注，帮助初学者创建训练...

AIGC 2024-02-05 人工智能

1665阅读

两亿参数时序模型替代LLM？谷歌突破性研究被批「犯新手错误」

最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting（用于时间序列预测的仅解码器基础模型）」。简而言之，...

人工智能 2024-02-05 人工智能

912阅读

iPhone动嘴10秒P图！UCSB苹果全华人团队发布多模态MGIE，官宣开源人人可玩

几天前，库克在苹果电话会上证实，「今年晚些时候会发布生成式AI」。 ChatGPT掀起全球热潮之后，苹果也在悄悄发力AI，曾曝出的大模型框架Ajax、AppleGPT等AI工具让业界充满了期待。 6月举办的WWDC上，这家曾霸占全球市值第一公司，将会宣布...

AIGC 2024-02-05 人工智能

854阅读

解读顺网算力与AI，破局AIGC落地“最后一公里”

全球知名AI科学家吴恩达和李飞飞在CES 2024上预测，2024年将是AI技术继续深化的一年，将成为下一次数字或工业革命真正的变革性驱动力。吴恩达还预测了2024年AI可能的突破性进展，其中包括边缘AI。吴恩达对边缘AI寄予厚望，他认为在笔记本电脑、PC...

生成式AI 2024-02-05 人工智能

905阅读

什么是人工智能语音发生器及其工作原理？

近年来，人工智能语音生成器已经成为一项强大的技术，它正在改变人们与机器交互和接收数字内容的方式。创新系统通过使用人工智能模仿人类语音模式来工作，从而产生更真实、更自然的声音。在本文中，我们将探索人工智能生成发音的有趣领域，阐明其内部结构以及使其听起来如...

AIGC 2024-02-04 人工智能

1157阅读

一文搞懂使用 Arthur Bench 进行 LLM 评估

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM 的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估领...

人工智能 2024-02-04 人工智能

892阅读

中文创意写作能力超GPT-4，「最会写」的中文大模型Weaver来了

ChatGPT 等通用大模型支持的功能成百上千，但是对于普通日常用户来说，智能写作一定是最常见的，也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字，但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域，大模型...

人工智能 2024-02-04 人工智能

989阅读

史上首个100%开源大模型重磅登场！破纪录公开代码/权重/数据集/训练全过程，AMD都能训

多年来，语言模型一直是自然语言处理（NLP）技术的核心，考虑到模型背后的巨大商业价值，最大最先进的模型的技术细节都是不公开的。现在，真·完全开源的大模型来了！来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员，联合发表了...

人工智能 2024-02-04 人工智能

818阅读

张晴晴：对话数据推动AIGC——大模型底层数据探索

“Training data is technology” . 数据即科技，OpenAI的联合创始人IlyaSutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球，一周前惊艳亮相的GPT-4更是...

人工智能 2024-02-03 人工智能

971阅读

如何用Stable Diffusion生成高质量的图全网最全介绍！（附资料）

Stable Diffusion无疑是最近最火的AI绘画工具之一，所以本期给大家带来了全新Stable Diffusion 提示词资料包（文末可获取） Stable Diffusion Stable Diffusion是一个开源的图像生成AI系统,...

生成式AI 2024-02-02 人工智能

2053阅读

Depth Anything：释放大规模无标注数据的深度估计

本文经自动驾驶之心公众号授权转载，转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“，来自香港大学、字节、浙江实验室和浙江大学。这项...

AIGC 2024-02-01 人工智能

923阅读

【深度学习】AIGC ，ControlNet 论文，原理，训练，部署，实战，教程（一）

论文：https://arxiv.53yu.com/pdf/2302.05543 代码：https://github.com/lllyasviel/ControlNet 得分几个博客完成这个事情的记录了，此篇是第一篇，摘录了一些论文内容。ControlN...

人工智能 2024-02-01 人工智能

1266阅读

AIGC内容分享(四十)：生成式人工智能（AIGC）应用进展浅析

目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构（1）数据层（2）算力基础设施层（3）算法及大模型层（4）AI...

人工智能 2024-02-01 人工智能

1554阅读

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

文章目录 ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三） Text-to-Text 模型 ChatGPT LaMDA PEER Meta AI Speech f...

生成式AI 2024-01-31 人工智能

963阅读

多模态LLM多到看不过来？先看这26个SOTA模型吧

当前 AI 领域的关注重心正从大型语言模型（LLM）向多模态转移，于是乎，让 LLM 具备多模态能力的多模态大型语言模型（MM-LLM）就成了一个备受关注的研究主题。近日，腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...

生成式AI 2024-01-31 人工智能

829阅读

AIGC的隐私安全问题及隐私保护技术

作者:京东科技杨博 ChatGPT 才出现两个月，就已经引起了学术界的关注。微软成为ChatGPT母公司OpenAI的合作伙伴，并确认投资百亿美元。同时，微软正计划将 OpenAI 的技术整合到其产品中，包括Bing搜索引擎和其他软件，以增强它们的能力...

大数据 2024-01-31 人工智能

1009阅读