预训练第23页 - AIGC资讯

ChatGPT论文：大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较（一）

摘要 ChatGPT的成功引发了一场AI竞赛，研究人员致力于开发新的大型语言模型（LLMs），以匹敌或超越商业模型的语言理解和生成能力。近期，许多声称其性能接近GPT-3.5或GPT-4的模型通过各种指令调优方法出现了。作为文本到SQL解析的从业者，我...

大数据 2024-02-05 人工智能

1105阅读

iPhone动嘴10秒P图！UCSB苹果全华人团队发布多模态MGIE，官宣开源人人可玩

几天前，库克在苹果电话会上证实，「今年晚些时候会发布生成式AI」。 ChatGPT掀起全球热潮之后，苹果也在悄悄发力AI，曾曝出的大模型框架Ajax、AppleGPT等AI工具让业界充满了期待。 6月举办的WWDC上，这家曾霸占全球市值第一公司，将会宣布...

AIGC 2024-02-05 人工智能

861阅读

飞浆AI studio人工智能课程学习（1）-大模型时代&优质Prompt

文章目录大模型时代&优质Prompt Al生成技术价值概览开始构建你的优质prompt 近十年深度学习模型主要更迭为什么大模型能够有如此强大的表现力大模型与Prompt 例1：画一幅画，呆萌的小猫躺在大泡泡中例2：请生成...

AIGC 2024-02-05 人工智能

1055阅读

ChatLaw：基于LLaMA微调的法律大模型

文章目录动机数据组成模型框架模型评估北大团队发布首个的中文法律大模型落地产品ChatLaw，为大众提供普惠法律服务。模型支持文件、语音输出，同时支持法律文书写作、法律建议、法律援助推荐。 github地址：https://g...

大数据 2024-02-05 人工智能

1597阅读

苹果研究团队揭示WRAP技术：用合成数据进行预训练大模型成本低准确性高

近几个月来，大型语言模型（LLMs）在人工智能社区中引起了极大的关注和流行。这些模型在文本摘要、问答、代码完成、内容生成等任务中展示出了强大的能力。然而，LLMs通常在不充分的网络抓取数据上进行训练。这些数据通常杂乱、无结构，表达不清晰。按照现有的扩展原...

大数据 2024-02-05 人工智能

977阅读

Segment Anything论文翻译，SAM模型，SAM论文，SAM论文翻译；一个用于图像分割的新任务、模型和数据集；SA-1B数据集

【论文翻译】- Segment Anything / Model / SAM论文论文链接： https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...

大数据 2024-02-05 人工智能

1499阅读

解读顺网算力与AI，破局AIGC落地“最后一公里”

全球知名AI科学家吴恩达和李飞飞在CES 2024上预测，2024年将是AI技术继续深化的一年，将成为下一次数字或工业革命真正的变革性驱动力。吴恩达还预测了2024年AI可能的突破性进展，其中包括边缘AI。吴恩达对边缘AI寄予厚望，他认为在笔记本电脑、PC...

生成式AI 2024-02-05 人工智能

911阅读

一文读懂「AIGC，AI Generated Content」AI生成内容

首先，让我们理解一下这两个概念。 AIGC，或者称之为人工智能生成内容，是指使用AI算法和模型来自动生成全新的、原创的内容。这种内容可以包括文本、图像、音频、视频等各种形式，甚至可以包括一些独特的形式，比如新颖的创意和设计。AIGC的应用领域非常广...

AIGC 2024-02-05 人工智能

1115阅读

【多模态】13、Vision-Language 模型在视觉任务中的调研

文章目录一、简介二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集三、迁移学习 3.1 使用 prompt tunin...

生成式AI 2024-02-05 人工智能

1184阅读

NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]

国内外大模型汇总列表中国大模型列表大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等，随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...

大数据 2024-02-04 人工智能

1508阅读

CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗？｜ DALL-E 3、Stable Diffusion等20+ 图像生成模型综述

随着科技飞速发展，CES（国际消费电子展）已然成为全球科技产业的风向标，每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会，不难发现其亮点纷呈，其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点，各大厂商纷纷展...

人工智能 2024-02-04 人工智能

1160阅读

一文搞懂使用 Arthur Bench 进行 LLM 评估

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM 的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估领...

人工智能 2024-02-04 人工智能

906阅读

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数...

生成式AI 2024-02-04 人工智能

903阅读

Github Copilot 功能介绍

Copilot 是一款由 GitHub 和 OpenAI 共同开发的编程工具，它基于人工智能技术，旨在帮助开发人员提高编码效率。Copilot 结合了 GitHub 的代码存储库和开源社区的力量，以及 OpenAI 的自然语言处理和机器学习能力，为开发人员...

人工智能 2024-02-04 人工智能

939阅读

中文创意写作能力超GPT-4，「最会写」的中文大模型Weaver来了

ChatGPT 等通用大模型支持的功能成百上千，但是对于普通日常用户来说，智能写作一定是最常见的，也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字，但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域，大模型...

人工智能 2024-02-04 人工智能

1000阅读

AI 绘画神器 Stable Diffusion 基础教程

AI 绘画工具的选择与运用 1.工作场景下 AI 绘画工具的选择目前文生图的主流 Al 绘画平台主要有三种: Midjourney、Stable Diffusion、DALL·E-2 2.如果要在实际工作场景中应用，我更推荐 Stable Dif...

人工智能 2024-02-04 人工智能

1026阅读

【AI绘画】stable diffusion原理解读，通俗易懂，直接喂到你嘴里！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）文章目录一、前言（可跳过）二、stable diffusion 1.clip 2...

AIGC 2024-02-04 人工智能

1107阅读

人工智能可以帮助改善云计算管理有哪些方式

当企业考虑云管理时，主要考虑的是运营流程，例如监控性能、维护安全性和确保合规性。这些都是成功开展业务的重要方面，但这只是云管理所需要的一部分。一个经常被忽视的关键方面是通过提供直观的工具和集成的支持流程来改善用户体验，从而消除企业IT基础设施的一些麻...

生成式AI 2024-02-04 人工智能

894阅读

人工智能大时代——AIGC综述

生成式AI分类模型按照输入输出的数据类型分类，目前主要包括9类。有趣的是，在这些已发布大模型的背后，只有六个组织（OpenAI, Google, DeepMind, Meta, runway, Nvidia）参与部署了这些最先进的模型。...

生成式AI 2024-02-04 人工智能

1058阅读

史上首个100%开源大模型重磅登场！破纪录公开代码/权重/数据集/训练全过程，AMD都能训

多年来，语言模型一直是自然语言处理（NLP）技术的核心，考虑到模型背后的巨大商业价值，最大最先进的模型的技术细节都是不公开的。现在，真·完全开源的大模型来了！来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员，联合发表了...

人工智能 2024-02-04 人工智能

830阅读

图领域首个通用框架来了！入选ICLR'24 Spotlight，任意数据集、分类问题都可搞定

能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性，又能够给出社交网络的朋友推荐？或者既能预测不同作者的论文引用，还可以发现基因网络中的人类衰老机制？你还真别说，被ICLR 2024接收为Spotlight的“One for All（OFA）...

生成式AI 2024-02-04 人工智能

901阅读

匿名论文提出奇招，增强大模型长文本能力居然还能这么做

一提到提高大模型长文本能力，就想到长度外推或者上下文窗口扩展? 不行，这些都太费硬件资源了。来看一个奇妙新解: 和长度外推等方法使用KV缓存的本质不同，它用模型的参数来存储大量上下文信息。具体办法就是建一个临时Lora模块，让它仅在长文本生成过程中“流...

生成式AI 2024-02-04 人工智能

850阅读

AIGC面经大全（持续更新）

目录 DDPM算法原理部分： DDIM算法原理部分：⾼阶采样⽅案：特征编码篇： Stable Diffusion篇： SDXL篇：⼤模型微调篇：控制模型篇：适配器篇： DDPM算法原理部分：简述DDP...

AIGC 2024-02-04 人工智能

1485阅读

ChatGPT4.0 ＞ChatGPT 3.5 ＞文心一言

文章目录前言一、ChatGPT4.0与ChatGPT3.5相比具有以下优点：二、ChatGPT和文心一言相比具有以下优点：总结前言 ChatGPT是一种基于自然语言处理的对话型人工智能模型，由OpenAI开发。它是使用...

人工智能 2024-02-04 人工智能

984阅读

基于LLaMA Factory，单卡3小时训练专属大模型 Agent

大家好，今天给大家带来一篇 Agent 微调实战文章 Agent（智能体）是当今 LLM（大模型）应用的热门话题 [1]，通过任务分解（task planning）、工具调用（tool using）和多智能体协作（multi-agent cooperat...

大数据 2024-02-03 人工智能

1513阅读

张晴晴：对话数据推动AIGC——大模型底层数据探索

“Training data is technology” . 数据即科技，OpenAI的联合创始人IlyaSutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球，一周前惊艳亮相的GPT-4更是...

人工智能 2024-02-03 人工智能

984阅读

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和dense embedding方...

大数据 2024-02-03 人工智能

1987阅读

LLaMA模型指令微调字节跳动多模态视频大模型 Valley 论文详解

Valley: Video Assistant with Large Language model Enhanced abilitY 大家好，我是卷了又没卷，薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师，带来最新的前沿AI知识和工具...

大数据 2024-02-03 人工智能

1080阅读

快速入门ChatGPT和AIGC：底层原理、热门工具、行业现状【我们能做什么】

最近大家热议的ChatGPT和AI绘画工具的底层技术原理是什么？是如何发展到现在的？有哪些应用场景、热门工具？AIGC产业上下游有哪些公司？作为普通用户，我们还能接触哪些应用AI技术打造的商业解决方案？…… 我们查阅了AIGC相关相关的调研报告和各类资料...

AIGC 2024-02-03 人工智能

1374阅读

大模型也有小偷？为保护你的参数，上交大给大模型制作「人类可读指纹」

大模型的预训练需要耗费巨量的计算资源和数据，因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产。然而，不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用，对预训练模型参数盗用的判断存在以下两方面的新问题： 1）预训练模型的...

生成式AI 2024-02-03 人工智能

922阅读

引言:ChatGPT与AIGC技术的发展与应用

1.背景介绍 1. 背景介绍自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge(ILSVRC ，深度学习技术开始引以为奉。随着算法的不断发展和优化，深度...

人工智能 2024-02-03 人工智能

1018阅读

年龄两岁，教龄一年半：婴儿AI训练师登上Science

在公开采访中，图灵奖得主 Yann LeCun 多次提到，现在的 AI 模型和人类婴儿相比，学习效率实在是太低了。那么，如果让一个 AI 模型去学习婴儿头戴摄像头拍到的东西，它能学到什么？最近，Science 杂志上的一篇论文进行了初步尝试。研究发现，...

大数据 2024-02-02 人工智能

825阅读

从零开始：了解ChatGPT和AIGC基础

1.背景介绍 1. 背景介绍自2012年的AlexNet在ImageNet大赛中取得卓越成绩以来，深度学习技术已经成为人工智能领域的重要技术。随着算力的提升和模型的优化，深度学习技术已经取得了巨大的成功，应用于图像识别、自然语言处理、语音识...

AIGC 2024-02-02 人工智能

1058阅读

匿名论文提出奇招！增强大模型长文本能力居然还能这么做

一提到提高大模型长文本能力，就想到长度外推或者上下文窗口扩展？不行，这些都太费硬件资源了。来看一个奇妙新解：和长度外推等方法使用KV缓存的本质不同，它用模型的参数来存储大量上下文信息。具体办法就是建一个临时Lora模块，让它仅在长文本生成过程中“...

大数据 2024-02-02 人工智能

869阅读

讯飞星火大模型重磅升级，对标GPT-4 Turbo！星火语音大模型发布，37个主流语种识别超OpenAI！

出品 | 51CTO技术栈（微信号：blog51cto） 1月30日，讯飞星火认知大模型V3.5成功发布！用核心能力的突破，回应时代的疑问。迈向更通用、实用的全民开放大模型，讯飞星火全面对标国际先进水平，同时首次发布星火语音大模型和星火开源大模型。 1、...

人工智能 2024-02-02 人工智能

1060阅读

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

AI2最新发布的开放语言模型（OLMo）框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码，AI2致力于让学术界和研究人员能够共同研究语言模型的科学，探索新的预训练数据子集对下游性能的影响，以...

大数据 2024-02-02 人工智能

812阅读

BiTA：创新AI方法加速大型语言模型生成

近年来，基于transformer架构的大型语言模型（LLMs）已经崭露头角。Chat-GPT和LLaMA-2等模型展示了LLMs参数的迅速增加，从几十亿到数万亿。尽管LLMs是非常强大的生成器，但由于所有参数的计算负载，它们在推理延迟方面存在问题。因此，...

人工智能 2024-02-02 人工智能

915阅读

Ai作画区域控制的几种方法

背景距上次发文章，又过去好久。这期分享给大家带来的是Ai作画的图结构控制几种方法。现在大家用AI作画大部分情况是直接使用AI单图生成能力，其实并不太会取考虑构图，也不太会考虑到大图的图结构这件事。其实构图这件事是一件很综合复杂的事情，很难去定义什么样的...

AIGC 2024-02-02 人工智能

947阅读

【AIGC-图片生成视频系列-5】I2V-Adapter：一种用于视频扩散模型的通用图像生成视频适配器

目录一. 项目与贡献概述二. 方法详解 a. 整体框架图 b. 帧相似性先验三. 一般化图像生成动画结果四. 基于个性化 T2I 模型的动画结果五. 结合ControlNet动画结果六. 项目论文和代码七. 个人思考与总结...

AIGC 2024-02-02 人工智能

1102阅读

【大语言模型】5分钟快速认识ChatGPT、Whisper、Transformer、GAN

5分钟快速认识ChatGPT、Whisper、Transformer、GAN 什么是ChatGPT? 什么是Whisper? 什么是Generative Pre-trained Transformer架构？什么是自然处理语言 NLP 的 Tr...

生成式AI 2024-02-02 人工智能

1082阅读

十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文

QLoRA 提出内存高效的微调方法！降低 LLaMA 模型微调内存占用，仅需数小时追赶 ChatGPT 引言：大模型微调的新时代随着人工智能技术的飞速发展，大型语言模型（Large Language Models，LLMs）已成为自然语言处理领域的重...

大数据 2024-02-02 人工智能

1543阅读

学习AIGC大模型必知的强化学习RL的核心代码示例，速进！！！

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 在人工智能的发展历程中，强化学习（RL）已成为推动技术突破的关键动力，尤其在自动化内容生成（AIGC）和大型语言模型（LLM）的领域中...

大数据 2024-02-01 人工智能

1175阅读

InternLM-XComposer2官网体验入口视觉语言AI模型文本图像合成在线使用地址

InternLM-XComposer2是一款领先的视觉语言模型，专注于自由形式文本图像合成与理解。该模型不仅能理解传统的视觉语言，还能从各种输入构建交织的文本图像内容，实现高度可定制的内容创作。InternLM-XComposer2 采用部分LoRA（PL...

AIGC 2024-02-01 人工智能

910阅读

【思路合集】talking head generation+stable diffusion

1 以DiffusionVideoEditing为baseline：改进方向针对于自回归训练方式可能导致的漂移问题：训练时，在前一帧上引入小量的面部扭曲，模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。在像VoxCeleb或L...

人工智能 2024-02-01 人工智能

1046阅读

媲美GPT-4的开源模型泄露！Mistral老板刚刚证实：正式版本还会更强

Mistral-Medium竟然意外泄露？此前仅能通过API获得，性能直逼GPT-4。 CEO最新发声：确有其事，系早期客户员工泄露。但仍表示敬请期待。图片换句话说，这个版本尚且还是旧的，实际版本性能还会更好。这两天，这个名叫“Miqu”的神秘模型...

AIGC 2024-02-01 人工智能

751阅读

赶超Gemini Pro，提升推理、OCR能力的LLaVA-1.6太强了

去年 4 月，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA（Large Language and Vision Assistant）。尽管 LLaVA 是用一个小的多模态指令数据集训练的，却在一些样本上展示了与 GPT-4...

大数据 2024-02-01 人工智能

894阅读

【网安AIGC专题10.19】论文6（顶会ISSTA 2023）：提出新Java漏洞自动修复数据集：数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会

How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面摘要贡献发现介绍背景：漏洞修复需求和Java漏洞修复方向动机方法贡献...

AIGC 2024-02-01 人工智能

1269阅读

小红书开源「InstantID」效果炸裂，被Yann LeCun点赞，迅速蹿上Github热榜

最近，有一群来自小红书的 95 后神秘团队，自称 InstantX，搞了个大动作 —— 开源「InstantID」项目。 InstantID 凭借着高质量的图像生成能力，在开源界掀起了一股热潮：不仅获得了众多技术大佬的点赞，更是在 GitHub 热榜上迅...

人工智能 2024-02-01 人工智能

946阅读

最强开源多模态生成模型MM-Interleaved：首创特征同步器

想象一下，AI 不仅会聊天，还长了「眼睛」，能看懂图片，甚至还会通过画画来表达自己！这意味着，你可以和它们谈天说地，分享图片或视频，它们也同样能用图文并茂的方式回应你。最近，上海人工智能实验室联合香港中文大学多媒体实验室（MMLab）、清华大学、商汤科...

AIGC 2024-02-01 人工智能

1009阅读

Depth Anything：释放大规模无标注数据的深度估计

本文经自动驾驶之心公众号授权转载，转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“，来自香港大学、字节、浙江实验室和浙江大学。这项...

AIGC 2024-02-01 人工智能

931阅读