大型模型第3页 - AIGC资讯

AI计算如何助推800G光模块发展？

...

人工智能 2024-01-23 人工智能

786阅读

AIGC（生成式AI）试用 17 -- 续2，生成式AI是什么

还是培训资料中的内容，重读一遍。列举内容，尝试理解的多那么一点点。 1. 生成式AI 生成式AI定义 - Generative AI, GenAI - 一种人工智能技术 - 对已经数据分类、预测 - 生成新的内容，包括文本、图像、音...

AIGC 2024-01-22 人工智能

1145阅读

“AI学会欺骗，人类完蛋了”？看完Anthropic的论文，我发现根本不是这回事啊

AGI若到来，人类是否会受到威胁，是一个大众热衷讨论同时研究者们也很关注的问题，从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文，提出关于“Sleeper Agen...

人工智能 2024-01-22 人工智能

823阅读

AIGC周报｜30秒定制一个文生图模型；60美元让AI玩转《我的世界》；手机版“文生图”模型：2秒不到出一张图

AIGC（AI Generated Content）即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT，以及 Dall·E 2、Stable Diffusion 等文生图模型，都属于 AIGC 的典型案例，它们通过借鉴现有的、人类创造的内容来...

人工智能 2024-01-20 人工智能

884阅读

ai绘画 ai模型对显卡的要求

AI是由很多层计算组成的，每一层计算都无差别地计算所有的节点，甚至是对所有的节点的排列组合。由于没有局部性，运行内存需要能够放得下一整个模型至少一层的运算量。如果运行内存不够大，就得把运算好的数据存储起来，放在外存，然后在外存读出没有运算的数据继续算，那这...

AIGC 2024-01-19 人工智能

3088阅读

GPU库存将到60万个！扎克伯格确认新目标：创建通用人工智能

1月19日消息，在科技领域，一股热潮正席卷而来，它源于一种坚定的信念，即科技行业正迈向实现超人、神级智能的道路上。引领这股潮流的旗手包括OpenAI，他们宣称要创造出这种通用人工智能（AGI）。而谷歌人工智能项目负责人杰米斯·哈萨比斯（Demis Ha...

大数据 2024-01-19 人工智能

863阅读

AIGC系列之：ControlNet原理及论文解读

《Adding Conditional Control to Text-to-Image Diffusion Models》目录 1.背景介绍 2.原理详解 2.1 Controlnet 2.2 用于Stable Diffusion的Contr...

人工智能 2024-01-18 人工智能

1474阅读

【AIGC】Controlnet:基于扩散模型的文生图的可控性

前言 controlnet可以让stable diffusion的生图变得可控。文章连接：https://arxiv.org/pdf/2302.05543.pdf 摘要冻结了stable diffusion的预训练模型并重用它的预训练...

AIGC 2024-01-17 人工智能

1311阅读

Stability AI发布Stable Code 3B模型，没有GPU也能本地运行

在文生图领域大火的 Stability AI，今天宣布了其 2024 年的第一个新 AI 模型：Stable Code 3B。顾名思义，Stable Code 3B 是一个拥有 30 亿参数的模型，专注于辅助代码任务。无需专用 GPU 即可在笔记本电...

大数据 2024-01-17 人工智能

835阅读

机器人领域首个开源视觉-语言操作大模型，RoboFlamingo框架激发开源VLMs更大潜能

近年来，大模型的研究正在加速推进，它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求，这自然引申出一个问题：能不能充分利用大模型能力，将其迁移到机器人领域，直接...

大数据 2024-01-17 人工智能

914阅读

GPT-4、百度文心一言摆擂，AI大模型将掀起新一轮AIGC军备竞赛？

科技云报道原创。一觉醒来，万众期待的GPT-4来了。OpenAI老板Sam Altman直接开门见山地介绍说：“这是我们迄今为止功能最强大的模型！”仅隔一天，“中国版ChatGPT”百度文心一言正式发布，双方大有摆擂之势。当深度学习推动AI技术...

生成式AI 2024-01-16 人工智能

928阅读

AIGC和ChatGPT推进百度、阿里、腾讯、华为大模型技术创新

生成式AI 2024-01-15 人工智能

1023阅读

可协助 AI 语言模型改善自我纠错能力，谷歌推出 BIG-Bench Mistake 数据集

IT之家 1 月 15 日消息，谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集，并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行了一系列评估研究。谷歌研究人员表示，由于...

人工智能 2024-01-15 人工智能

743阅读

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

1181阅读

拆掉英伟达护城河，细节曝光！世界最快超算用3072块AMD GPU训完超万亿参数LLM

用AMD的软硬件系统也能训练GPT-3.5级别的大模型了。位于美国橡树岭国家实验室（Oak Ridge National Laboratory）的全世界最大的超算Frontier，集合了37888个MI250X GPU和9472个Epyc 7A53 C...

大数据 2024-01-15 人工智能

848阅读

一文读懂 LLM 可观测性

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM (大型语言模型可观测性，本文将继续聚焦在针对 LLM 的可观测性进行解析，使得大家能够了解 LLM 的可观测性的必要性以及其核心的生态体系知...

生成式AI 2024-01-15 人工智能

1428阅读

为大模型恶补数学，上交开源MathPile语料库，95亿tokens，还可商用

在当前智能对话模型的发展中，强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库，而如何构建这样的语料库，已成为行业中的一大挑战。在备受瞩目的 AI for Math 领域，由于高质量的数学语料相对稀缺，这限制了生成式...

AIGC 2024-01-13 人工智能

873阅读

回顾精彩瞬间！IEEE Spectrum盘点2023年度热门AI故事

又是冬日，又到结尾，气温回升了一点，苍茫天地间仍有一些尚未消融的洁白。「雪霁银装素，桔高映琼枝」。不知大家这一年过得怎么样呢？ 2023很可能成为人工智能历史上最狂野、最戏剧性的年份之一。 Spectrum总结了本年度关于AI的最受欢迎的文章，...

AIGC 2024-01-08 人工智能

890阅读

专补大模型短板的RAG有哪些新进展？这篇综述讲明白了

大型语言模型（LLMs）已经成为我们生活和工作的一部分，它们以惊人的多功能性和智能化改变了我们与信息的互动方式。然而，尽管它们的能力令人印象深刻，但它们并非无懈可击。这些模型可能会产生误导性的 “幻觉”，依赖的信息可能过时，处理特定知识时效率不高，缺乏...

AIGC 2024-01-06 人工智能

902阅读

迷你AI模型TinyLlama发布：高性能、仅637MB

经过一番期待，TinyLlama项目发布了一款引人注目的开源模型。该项目于去年9月启动，开发人员致力于在数万亿标记上训练一款小型模型。在经历了一些辛勤工作和一些挫折之后，TinyLlama团队如今发布了这个模型。这个模型有着10亿个参数，大约在训练数据上进...

生成式AI 2024-01-06 人工智能

937阅读

从模型、数据和框架三个视角出发，这里有份54页的高效大语言模型综述

大规模语言模型（LLMs）在很多关键任务中展现出显著的能力，比如自然语言理解、语言生成和复杂推理，并对社会产生深远的影响。然而，这些卓越的能力伴随着对庞大训练资源的需求（如下图左）和较长推理时延（如下图右）。因此，研究者们需要开发出有效的技术手段去解决其...

人工智能 2024-01-02 人工智能

873阅读

Gemini vs GPT-4V到底哪家强？视觉-语言模型的全面比较和结合使用

概括大家好，我是戚张扬，目前就读于香港大学，今天和大家分享一篇我们关于视觉语言模型最新的研究，这篇论文提供了对谷歌的Gemini和OpenAI的GPT-4V(ision 两个SOTA模型的深入定性比较研究。我们的研究涉及到对这两个模型在视觉语言能力、与...

大数据 2023-12-29 人工智能

1268阅读

Gemini偷师文心一言？这一局，百度给中国大模型找回了面子！

大数据产业创新服务媒体 ——聚焦数据 · 改变商业在模型表现方面，百度文心一言、阿里通义千问、华为盘古、腾讯混元、科大讯飞星火等，都在说超过ChatGPT-3.5，马上要追上GPT-4，甚至在某些领域的表现超越了GPT-4。...

生成式AI 2023-12-28 人工智能

927阅读

LLaMA 简介：一个具有 650 亿参数的基础大型语言模型官网介绍

2023 年 2 月 24 日更新：我们刚刚推出了Llama 2 - 有关最新信息的更多信息，请参阅我们关于 Llama 2 的博客文章。作为 Meta 致力于开放科学的一部分，今天我们公开发布 LL...

人工智能 2023-12-25 人工智能

1243阅读

【LLM】LLaMA简介：一个650亿参数的基础大型语言模型

LLaMA简介：一个650亿参数的基础大型语言模型 Paper Setup 其他资料作为 Meta 对开放科学承诺的一部分，今天我们将公开发布 LLaMA (大型语言模型 Meta AI ，这是一个最先进的大型语言基础模型，旨在帮...

AIGC 2023-12-23 人工智能

1217阅读

AI Native工程化：百度App AI互动技术实践

作者 | GodStart 导读随着AI浪潮的兴起，越来越多的应用都在利用大模型重构业务形态，在设计和优化Prompt的过程中，我们发现整个Prompt测评和优化周期非常长，因此，我们提出了一种Prompt生成、评估与迭代的一体化解决方案，...

人工智能 2023-12-22 人工智能

877阅读

AIGC专题报告：生成式人工智能人人可用的新时代

今天分享的AIGC系列深度研究报告：《AIGC专题报告：生成式人工智能人人可用的新时代》。（报告出品方：埃森哲）报告共计：21页人工智能发展迎来新拐点 ChatGPT 正在唤醒全球对人工智能（AI）变革潜力的认知，激发起前所未有...

人工智能 2023-12-22 人工智能

892阅读

【大模型AIGC系列课程 3-7】领域&私域对话数据收集与生成

重磅推荐专栏：《大模型AIGC》；《课程大纲》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深...

大数据 2023-12-22 人工智能

871阅读

MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT

MosaicML正在推出其第二个开源大型语言模型（LLM），称为MPT-30B，这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义，我采访了MosaicML联合创始人兼首席执行官Naveen Rao。他之前的创业公司是...

生成式AI 2023-12-20 人工智能

905阅读

研究团队开发开源大模型训练框架 Oobleck 提供快速且有保障的故障修复

随着对生成式人工智能技术需求的激增，大型语言模型的训练和容错性要求也在不断增加。为应对这一挑战，密歇根大学的研究人员开发了一款名为Oobleck的开源大型模型训练框架。该框架采用管道模板的概念，为大型模型的预训练提供了快速而可靠的故障恢复机制。项目地址...

生成式AI 2023-12-19 人工智能

852阅读

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）数据窃取攻击对抗攻击（用途：漏洞隐藏）后门攻击（加触发器+标签翻转）

代码大模型的应用及其安全性研究写在最前面一些想法大型模型输出格式不受控制的解决方法大模型介绍（很有意思）GPT 模型家族的发展 Chatgpt 优点缺点 GPT4 其他模型补充：self-instruct合成数据 Cod...

人工智能 2023-12-19 人工智能

879阅读

AIGC参数量节节攀升，对存储带来的挑战如何解决？

引言近期，AIGC 相关产品如同雨后春笋一般不断涌现。但在技术层面，大家普遍的关注点更多集中在性能方面，却经常忽略了存储对推理和训练效率的影响，以及 AIGC 内容可能带来的合规风险。我们特邀腾讯云存储的产品负责人崔剑老师和益企研究院创始人、腾讯云 ...

AIGC 2023-12-19 人工智能

1156阅读

科学家：大型 AI 模型已可自动生成小型 AI 工具

12 月 18 日消息，据 Businessinsider 报道，大型 AI 模型现在已经强大到可以完全自动地创建新的小型 AI 工具，无需任何人类干预。来自麻省理工学院、加州大学多个校区和 AI 科技公司 Aizip 的科学家团队表示，他们已经能...

人工智能 2023-12-18 人工智能

869阅读

AIGC｜AGI究竟是什么？为什么大家都在争先入场？

一、AI大语言模型进入爆发阶段 2022年12月ChatGPT突然爆火，原因是其表现出来的智能化已经远远突破了我们的常规认知。虽然其呈现在使用者面前仅仅只是一个简单的对话问答形式，但是它的内容化水平非常强大，甚至在某些方面已经超过人类了，这是人工智能...

AIGC 2023-12-16 人工智能

950阅读

用GPT-2监督GPT-4，防止AI毁灭人类? OpenAI Ilya超级对齐团队首篇论文出炉

就在刚刚，OpenAI首席科学家Ilya领衔的超级对齐团队，发布了成立以来的首篇论文！团队声称，已经发现了对超人类模型进行实证对齐的新研究方向。未来超级AI系统对齐的一个核心挑战——人类需要监督比自己更聪明人工智能系统。 OpenAI的最新研究做了...

大数据 2023-12-16 人工智能

871阅读

【腾讯云 HAI域探秘】使用Stable Diffusion大模型生成惊世骇俗的图片！

文章目录前言环境准备高性能应用服务 HAI资格申请购买HAI高性能服务生成图片界面汉化：输入提示词生成图片参数列表：根据提示词生成图片总结：优点：缺点：前言 AI绘画工具的发展历史可以追溯...

大数据 2023-12-15 人工智能

1003阅读

Gemini官网体验入口谷歌多模态AI软件app免费下载地址

《Gemini》是由 DeepMind 开发的一款先进的人工智能模型，它从根本上构建为多模态，能够在文本、图像、视频、音频和代码之间无缝进行推理。这标志着 AI 如何帮助改善我们日常生活的重大飞跃。想要亲自体验《Gemini》吗?下面为大家提供《Gemin...

大数据 2023-12-13 人工智能

917阅读

面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt

近日，阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型，可以从简单的图片描述中生成高质量的提示词，从而使文生图模型能够生成更美观的图像。BeautifulP...

AIGC 2023-12-13 人工智能

862阅读

通义千问72B模型荣登大模型评测平台OpenCompass榜首

中国权威的大型模型评估平台OpenCompass最近更新其排名，通义千问72B模型以67.1的高分荣登榜首。 OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台，其评估范围涵盖学科、语言、知识、理解和推理五个维度，能够全面评估大型模型的...

生成式AI 2023-12-13 人工智能

857阅读

LLM之Prompt（二）：清华提出Prompt 对齐优化技术BPO

论文题目：《Black-Box Prompt Optimization: Aligning Large Language Models without Model Training》论文链接：https://arxiv.org/abs/2311.041...

大数据 2023-12-12 人工智能

983阅读

还在担心发抖音没素材跟文案？[腾讯云HAI] AIGC带你蹭热度“今年你失去了什么？”

目录 ?前言： ?了解高性能应用服务 HAI ?即插即用 · 轻松上手 ?横向对比 · 青出于蓝 ?应用场景-AI作画 ?应用场景-AI对话 ?应用场景-算法研发 ?使用HAI进行AI作画 ?基于 ChatGLM2-6B 创作个人专属的知...

生成式AI 2023-12-09 人工智能

933阅读

“大海捞针”实验验证RAG+GPT-4 Turbo模型卓越性能只需4%的成本

近期的“大海捞针”实验揭示了RAG+GPT-4Turbo模型的卓越性能，只需4%的成本，便能在生成响应时实现卓越的准确性。这标志着大型模型领域的一次重要突破。在这个实验中，研究者使用了三种基本技术，包括上下文窗口填充、RAG（检索增强生成）和微调，以使L...

大数据 2023-12-08 人工智能

857阅读

从零开始训练 Stable Diffusion 的成本＜ 16 万美元

我们想知道使用我们的流数据集、Composer 和 MosaicML 云平台从头开始训练稳定扩散模型需要多少时间（和金钱）。我们的结果：13 天内我们将花费 79,000 个 A100 小时，总培训成本不到 160,000 美元。我们的工具不仅将时间和成本...

大数据 2023-12-07 人工智能

1021阅读

AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models

AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models 代码：lllyasviel/ControlNet: Let us control di...

AIGC 2023-12-06 人工智能

967阅读

大模型版“5年高考3年模拟”来了！6141道数学题，还是多模态的那种

大模型的“5年高考3年模拟”数学题来了，还是加强强强版！微软、加州大学洛杉矶分校（UCLA）、华盛顿大学（UW）联合打造全新多模态数学推理基准数据集。名为“MathVista”。涵盖各种题型共6141个问题，来源于28个现有的多模态数据集和3个新标...

生成式AI 2023-12-05 人工智能

925阅读

GPT-4惊人表现：文字序列混乱不影响阅读理解

近日，日本东京大学研究人员发现一个有趣的现象:GPT-4在面对文字序列乱序的情况下，仍能准确理解和恢复原文。这一发现与其他大型模型相比显得格外突出。研究人员通过一系列实验和测试基准，如Scrambled Bench，验证了GPT-4的优越性能。实验结果显...

生成式AI 2023-12-04 人工智能

817阅读

Linux 中的机器学习：Whisper——自动语音识别系统

Whisper 是一种自动语音识别 (ASR 系统，使用从网络收集的 680000 小时多语言和多任务数据进行训练，Whisper 由深度学习和神经网络提供支持，是一种基于 PyTorch 构建的自然语言处理系统，这是免费的开源软件。安装Whisp...

大数据 2023-12-02 人工智能

1060阅读

研究称：生成一张AI图像所消耗能源相当于给手机充满电

根据 AI 初创公司 Hugging Face 和卡内基梅隆大学的研究人员进行的一项新研究，每次使用 AI 生成图像、撰写电子邮件或向聊天机器人提问，都会对地球造成一定的负担。实际上，使用强大的 AI 模型生成一张图像所消耗的能源相当于给手机充满电，该研...

AIGC 2023-12-01 人工智能

892阅读

北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人

近日，北京大学和中山大学等机构的研究者提出了一种名为Chat-UniVi的视觉语言大模型，实现了统一的视觉表征，使其能够同时处理图片和视频任务。这一框架的独特之处在于，它不仅在深度学习任务中表现卓越，而且仅需短短三天的训练时间，就能够训练出具有130亿参数...

大数据 2023-11-29 人工智能

842阅读

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型

内容来源：@xiaohuggg Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型该模型是由Hugging Face团队开发，它在Whisper核心功能的基础上进行了优化和简化，体积缩小了50%。速度提高了6倍。并...

AIGC 2023-11-24 人工智能

1110阅读