训练数据第27页

LCM：大大加快生成高质量图像的新方法

作者丨Mike Young 译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）图片得益于一种名为潜在一致性模型（LCM）的新技术，文本转换成图像的AI即将迎来重大飞跃。潜在扩散模型（LDM）等传统方法在使用...

人工智能 2023-11-30 人工智能

1049阅读

百度搜索内容HTAP表格存储系统

作者 | Chaos 导读本文主要介绍百度搜索内容存储团队应对海量互联网数据分析计算需求时，在构建HTAP表格存储系统方向上的一些技术思考。全文4683字，预计阅读时间12分钟。 01 业务背景百度搜索内容存储团队主...

生成式AI 2023-11-30 人工智能

922阅读

开源生成式AI初创平台together.ai融资7.3亿元

Together AI，一家专注于生成式人工智能（AIGC）领域的初创平台，宣布在A轮融资中获得7.3亿元人民币，由凯鹏华盈领投，英伟达等多家公司跟投。 Together AI强调开源在大模型领域的重要性，发布了多个备受好评的开源产品，包括类ChatGPT...

大数据 2023-11-30 人工智能

907阅读

AI测试｜史上最全，细数AIGC在测试领域落地的困难点

一、引言&背景自2022年由横空出世的ChatGPT引发的各类AIGC（Generative AI）爆发以来，人们对其在各个领域的应用潜力产生了极大的兴趣。在研发领域，各种研究已经证明了Github Copilot在研发效能提高上的积极作用。...

AIGC 2023-11-29 人工智能

1402阅读

北大最新多模态大模型开源：在混合数据集上训练，无需修改直接用到图像视频任务

训完130亿参数通用视觉语言大模型，只需3天！北大和中山大学团队又出招了——在最新研究中，研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架，可以大大减少VLM（视觉语言大模型）在训练和推理过程中的开销。具体而言，团队按照提出的新框架...

人工智能 2023-11-29 人工智能

845阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1493阅读

Copilot 工作原理

Copilot 是如何工作的？它的背后算法是什么？ Copilot 的工作原理可以大致分为两个阶段：第一阶段是从海量代码库中抽取出有效的代码段和语句，这些代码段用于训练AI模型；第二阶段则是谷歌的自然语言处理技术和深度神经网络技术，将文本解析成进一步的代...

人工智能 2023-11-29 人工智能

1080阅读

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

AIGC 2023-11-29 人工智能

1059阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

1256阅读

AIGC之GPT-4：GPT-4的简介与详细攻略

AIGC之GPT-4：GPT-4的简介与详细攻略简介欢迎来到人工智能生成内容（AIGC）时代的新篇章！本篇博客将介绍GPT-4（Generative Pre-trained Transformer 4）的核心原理、意义、亮点、技术点、缺点以及使...

人工智能 2023-11-28 人工智能

1276阅读

全球首份《AI系统安全开发准则》发布，提出4方面安全监管要求

2023年11月26日，美国、英国、澳大利亚等18个国家的网络安全监管部门联合发布了全球首份《AI系统安全开发准则》，旨在实现保护人工智能模型不被恶意篡改，并敦促人工智能公司在开发或使用人工智能模型时更加关注“设计安全”。作为这份准则制定的主要参...

人工智能 2023-11-28 人工智能

885阅读

Kumo.AI推出全新预测性AI平台引入了类似SQL的预测性查询语言

近年来，技术的快速发展已经改变了企业的业务模式，人工智能成为全球范围内的核心讨论话题。在这一背景下，Kumo.AI宣布推出了一款全新的预测性AI平台，引入了类似SQL的预测性查询语言。相较于生成式AI，预测性AI更专注于基于当前数据预测未来趋势，能够处理更...

大数据 2023-11-28 人工智能

830阅读

2024年模拟和机器人趋势

目前的主要趋势是提供不同类型的模拟来评估和控制机器人装置和工作空间。仿真能够帮助人们工程设计对制造和工业流程最有效的机器人。这是如何运作的?仿真的一大贡献是能够弄清楚机器人部署后的工作会是什么样子。新型建模和仿真的发明有助于将机器人技术融入工作世界...

人工智能 2023-11-28 人工智能

797阅读

在少样本学习中，用SetFit进行文本分类

译者 | 陈峻审校 | 重楼在本文中，我将向您介绍“少样本（Few-shot）学习”的相关概念，并重点讨论被广泛应用于文本分类的SetFit方法。传统的机器学习（ML）在监督（Supervised）机器学习中，大量数据集被用于模型训练，以便...

人工智能 2023-11-28 人工智能

960阅读

AWS CodeWhisperer产品初体验

CodeWhisperer 简介 CodeWhisperer 是亚⻢逊出品的一款基于机器学习的通用代码生成器，可实时提供代码建议。在编写代码时，它会自动根据我们现有的代码和注释生成建议。从单行代码建议到完整的函数，它可为我们提供各种大小和范围的个性...

大数据 2023-11-28 人工智能

905阅读

QQGC？揭秘QQ的AI绘画大模型技术

?腾小云导读 2022年来，AIGC概念迅速出圈并快速形成产业生态，成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC，本文将介绍在QQGC基础大模型训练中的实践和探索，接着往下看吧~...

生成式AI 2023-11-28 人工智能

1048阅读

DALLE2论文解读及实现(一)

DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents paper: https://cdn.openai.com/papers/dall-e-2.pdf githu...

人工智能 2023-11-27 人工智能

1067阅读

单个A100生成3D图像只需30秒，这是Adobe让文本、图像都动起来的新方法

2D 扩散模型极大地简化了图像内容的创作流程，2D 设计行业也因此发生了变革。近来，扩散模型已扩展到 3D 创作领域，减少了应用程序（如 VR、AR、机器人技术和游戏等）中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型，生成具有评分蒸馏采样（S...

大数据 2023-11-27 人工智能

910阅读

【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型

文章目录一、背景二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择三、效果四、思考论文：Learning Transferabl...

AIGC 2023-11-27 人工智能

2281阅读

疑似威胁人类？OpenAI神秘Q*项目更多信息曝光，马斯克、Lecun下场争论…

夕小瑶科技说原创作者 | 王二狗大家好我是二狗随着前天 OpenAI 官宣 Sam Altman 将回归，并继续担 CEO,OpenAI“宫斗事件”已经告一段落了。然而，对于专业吃瓜的二狗来说，有一个核心问题还是没有搞明白： Sam Altman...

AIGC 2023-11-27 人工智能

946阅读

Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享

OVD技术简介目标检测是计算机视觉领域中的一项核心任务，其主要目标是让计算机能够自动识别图片中目标的类别，并准确标示每个目标的位置。目前，主流的目标检测方法主要针对闭集目标的开发，即在任务开始之前需要对待检测目标进行类别定义，并进行人工数据标注，通...

大数据 2023-11-27 人工智能

1509阅读

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...

AIGC 2023-11-27 人工智能

1529阅读

每日学术速递1.30

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理更多Ai资讯：今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...

生成式AI 2023-11-26 人工智能

850阅读

创新性AI系统SoG: 在各种游戏中击败人类，又能学习玩新游戏

在人工智能领域，使用游戏作为性能指标的传统悠久而广泛。EquiLibre Technologies、Sony AI、Amii和Midjourney等研究团队与Google DeepMind合作推出的“Student of Games”（SoG）算法，通过结...

生成式AI 2023-11-26 人工智能

860阅读

大模型界的“熊猫烧香”，可对文生图模型造成巨大伤害！

《麻省理工技术评论》分享了一个名为Nightshade的投毒工具，可以对DALL-E、Midjourney 和Stable Diffusion等文生图模型的训练数据造成造成巨大伤害，以帮助艺术家们防止非法爬取其画作数据，用于大模型训练，同时揭露了模型存在的...

生成式AI 2023-11-26 人工智能

1050阅读

深度解读AIGC存储解决方案

5月26日，2023数据基础设施技术峰会在苏州举办，腾讯云首席存储技术专家温涛受邀出席并分享了腾讯云领先的存储技术在AIGC场景中的应用，通过对AIGC业务流程和场景的提炼，从内容生成、内容审核和内容智理三要素介绍了如何智能的存储和管理数据。下面我们一起回...

大数据 2023-11-26 人工智能

1068阅读

人类考92分的题，GPT-4只能考15分：测试一升级，大模型全都现原形了

AutoGPT 的得分也凉凉。 GPT-4自诞生以来一直是位「优等生」，在各种考试（基准）中都能得高分。但现在，它在一份新的测试中只拿到了15分，而人类能拿92。这套名叫「GAIA」的测试题由来自 Meta-FAIR、Meta-GenAI、Hugging...

AIGC 2023-11-25 人工智能

957阅读

【网安AIGC专题11.1】11 Coreset-C 主动学习：特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)

Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面论文名片先验知识的补充主动学习采样函数 benchmark基准和base...

大数据 2023-11-25 人工智能

1010阅读

Meta AI研究团队新AI模型： Llama 2 大语言模型

Llama是Facebook Research团队开发的基础语言模型集，旨在提供广泛的语言理解能力。它基于转换器架构，参数范围从7B到65B。通过使用Llama模型，研究人员和开发人员可以构建更先进的自然语言处理系统。您可以在GitHub上找到相关的代...

人工智能 2023-11-25 人工智能

943阅读

通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测

引言 “克隆 dev 环境到 test 环境，等所有服务运行正常之后，把访问地址告诉我”，“检查所有项目，告诉我有哪些服务不正常，给出异常原因和修复建议”，在过去的工程师生涯中，也曾幻想过能够通过这样的自然语言指令来完成运维任务，如今 AI 助手 Ap...

大数据 2023-11-25 人工智能

1239阅读

使用QLoRA对Llama 2进行微调的详细笔记

使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的，大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。导入库...

生成式AI 2023-11-25 人工智能

800阅读

【多模态】4、Chinese CLIP | 专为中文图文匹配设计

文章目录一、背景二、方法 2.1 基础内容 2.2 数据集 2.3 预训练方法 2.4 模型尺寸三、效果四、代码 4.1 推理论文：Chinese CLIP: Contrastive Vision-Language Pr...

人工智能 2023-11-24 人工智能

2487阅读

LLaMA-2论文阅读

1. 基本介绍 LLaMA-2是2023年7月24日Meta发布的LLaMA第二代，跟LLaMA-1几个显著区别: 免费可商用版本的大模型 context上下文增加了一倍，从2K变为了4K 训练的总token数从1.0T/1.4T增加为2.0T(...

生成式AI 2023-11-24 人工智能

1165阅读

国产大模型黑马诞生，千亿级拿下双榜第一！知识正确性能力突出，大幅降低LLM幻觉问题

【新智元导读】夸克，也下场大模型了。甫一问世，夸克大模型就迅速登顶权威测评双榜第一，幻觉率大幅降低，可以预见，风靡年轻人的夸克APP，要掀起新的飓风了。最近的各大手机厂商和互联网公司，都在卯足了劲儿地发布大模型。而其中的一匹黑马，显得格外引人注目——...

人工智能 2023-11-24 人工智能

889阅读

OpenAI神秘新模型Q*曝光，太强大让董事会警惕，或是奥特曼被开除导火索

OpenAI宫斗大戏刚刚落幕，马上又掀起另一场轩然大波！路透社曝光，在奥特曼被解雇之前，几位研究人员给董事会写的警告信可能是整个事件导火索：内部名为Q （发音为Q-Star）*的下一代AI模型，过于强大和先进，可能会威胁人类。 Q*正是由这场风暴的中...

AIGC 2023-11-24 人工智能

744阅读

AI 绘画Stable Diffusion 研究（十七）SD lora 详解（上）

大家好，我是风雨无阻。本期内容： Lora的原理是什么？ Lora如何下载安装？ Lora如何使用？大家还记得 AI 绘画Stable Diffusion 研究（三）sd模型种类介绍及安装使用详解这篇文章中，曾简单介绍了Lora的安装和使用吗？...

生成式AI 2023-11-24 人工智能

1193阅读

智慧政务，长远布局——AIGC引领，加速推进数字化政府建设

在人工智能、虚拟现实等领域迅猛发展且日益成熟的背景下，AI行业正迈向蓬勃发展的全新阶段，市场规模持续扩张。与此同时，数字服务也正在蓬勃兴起，新一代信息技术为数字政府构建了坚实支撑，重塑了政务信息化管理、业务架构以及技术架构。在这一背景下，政府以大数据为驱动...

生成式AI 2023-11-23 人工智能

1027阅读

Stable Diffusion如何生成高质量的图-prompt写法介绍

文章目录 Stable Diffusion 使用尝试下效果 prompt的编写技巧 prompt 和 negative prompt Prompt格式 Prompt规则细节优化 Guidance Scale 总结 Sta...

人工智能 2023-11-23 人工智能

1187阅读

CART算法解密：从原理到Python实现

本文深入探讨了CART（分类与回归树）算法的核心原理、实现方法以及应用场景。文章首先介绍了决策树的基础知识，然后详细解析了CART算法的工作机制，包括特征选择和树的构建。接着，通过Python和PyTorch的实例代码展示了CART算法在实际问题中的应用。...

大数据 2023-11-23 人工智能

861阅读

吴恩达AIGC《How Diffusion Models Work》笔记

1. Introduction Midjourney，Stable Diffusion，DALL-E等产品能够仅通过Prompt就能够生成图像。本课程将介绍这些应用背后算法的原理。课程地址：https://learn.deeplearning...

大数据 2023-11-23 人工智能

827阅读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读

LLMs之LLaMA：《LLaMA: Open and Efficient Foundation Language Models》翻译与解读导读：该论文提出了一个开源的大规模语言模型LLaMA，2048个A100-80G训练21天。该...

大数据 2023-11-22 人工智能

1131阅读

通用人工智能（AGI）离我们还有多远

人工智能（AI）是当今科技领域最热门和最具影响力的话题之一，它已经渗透到了我们生活和工作的方方面面，从电影推荐和语音助手，到自动驾驶和医疗诊断。AI的发展也引发了人们对未来的想象和期待，尤其是对通用人工智能（Artificial General Inte...

大数据 2023-11-22 人工智能

946阅读

教你如何使用PyTorch解决多分类问题

本文分享自华为云社区《使用PyTorch解决多分类问题：构建、训练和评估深度学习模型》，作者：小馒头学Python。引言当处理多分类问题时，PyTorch是一种非常有用的深度学习框架。在这篇博客中，我们将讨论如何使用PyTorch来解决多分类...

人工智能 2023-11-22 人工智能

803阅读

Stable Video Diffusion来了，代码权重已上线

AI 画图的著名公司 Stability AI，终于入局 AI 生成视频了。本周二，基于 Stable Diffusion 的视频生成模型 Stable Video Diffusion 来了，AI 社区马上开始了热议。很多人都表示「我们终于等到了」...

AIGC 2023-11-22 人工智能

819阅读

计算机视觉中目标检测的数据预处理

本文涵盖了在解决计算机视觉中的目标检测问题时，对图像数据执行的预处理步骤。首先，让我们从计算机视觉中为目标检测选择正确的数据开始。在选择计算机视觉中的目标检测最佳图像时，您需要选择那些在训练强大且准确的模型方面提供最大价值的图像。在选择最佳图像时，考...

人工智能 2023-11-22 人工智能

794阅读

运行基于云的生成式AI系统的几个优秀实践

译者 | 布加迪审校 | 重楼您猜怎么着？云计算会议现在是生成式AI会议。怎么会这样？很简单，云提供商将生成式AI视为销售更多云服务的最佳方式了。随着企业界转向AI驱动的生态系统，这一幕主要在云计算环境中上演。在这里您通常可以找到最先进的生成式A...

人工智能 2023-11-22 人工智能

812阅读

【文心一言 vs. 通义千文】一言对千问：自百度之后，阿里终于还是出手了——通义千问

通义千问： https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录通义千问：达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...

人工智能 2023-11-22 人工智能

1123阅读

程序员眼中的 ChatGPT

作者 | Bright Liao 作为一个一直对AI 技术很感兴趣的软件开发工程师，早在深度学习开始火起来的2015、2016年，我就开始了相关技术的学习。当时还组织了公司内部同样有兴趣的同学一起研究，最终的成果汇集成几次社区中的分享以及几篇学习文章（见...

AIGC 2023-11-21 人工智能

788阅读

Stable Diffusion - 采样器 DPM++ 3M SDE Karras 与 SDXL Refiner 测试

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132978866 Paper: DPM-Solver++: Fas...

大数据 2023-11-21 人工智能

1429阅读

Stable Diffusion - 图像控制插件 ControlNet (OpenPose) 配置与使用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131591887 论文：Adding Conditional Co...

AIGC 2023-11-21 人工智能

1822阅读