数据集第43页 - AIGC资讯

软件开发人员指南：在自己的数据上训练ChatGPT

译者 | 李睿审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto） OpenAI公司推出的ChatGPT对于对话式人工智能具有革命性意义。虽然其开箱即用的功能令人印象深刻，但ChatGPT的功能本质上受到2021年固有训练数据的...

人工智能 2024-01-15 人工智能

914阅读

可协助 AI 语言模型改善自我纠错能力，谷歌推出 BIG-Bench Mistake 数据集

IT之家 1 月 15 日消息，谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集，并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行了一系列评估研究。谷歌研究人员表示，由于...

人工智能 2024-01-15 人工智能

754阅读

Stable Diffusion XL（SDXL）核心基础知识

文章目录一、Stable Diffusion XL基本概念二、SDXL模型架构上的优化（一）SDXL的整体架构（二）VAE （三）U-Net （四）text encoder （五）refiner model 三、SDXL在训练上的技...

人工智能 2024-01-15 人工智能

2368阅读

【网安AIGC专题10.11】论文1：生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)

论文1：Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面论文总结背景知识介绍语言模型双向语言模型单向语言模型自动程序修复（...

大数据 2024-01-15 人工智能

974阅读

精确指出特定事件发生时间！字节&复旦大学多模态大模型解读视频太香了

字节&复旦大学多模态理解大模型来了：可以精确定位到视频中特定事件的发生时间。比如在下面这个视频中：狗子转身看镜头时的时间戳是多少？什么时候用爪子推开滑板？在这里，视频中的宝宝什么时候推起眼镜、舒展了一下身体？又是什么时候翻的书？对...

生成式AI 2024-01-15 人工智能

837阅读

能找神经网络Bug的可视化工具，Nature子刊收录

研究人员发现，在神经网络推理的某些数据图中存在尖峰，这些尖峰往往出现在神经网络判断模糊与产生错误的地方。观察这些尖峰，研究人员可以更容易发现人工智能系统中的故障点。从分析癌症突变的原因到决定谁应该获得贷款，在解决这些问题的过程中，仿照人脑的神经网络比人...

AIGC 2024-01-15 人工智能

780阅读

RoboFusion：通过SAM实现稳健的多模态3D检测

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文链接：https://arxiv.org/pdf/2401.03907.pdf 多模态3D检测器致力于探索安全可靠的自动驾驶感知系统。然而，尽管在干净的基准数据集上实现了最先进的（SOTA）性能，...

大数据 2024-01-15 人工智能

958阅读

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

1192阅读

大模型隐蔽后门震惊马斯克：平时人畜无害，提到关键字瞬间“破防”

“耍心机”不再是人类的专利，大模型也学会了！经过特殊训练，它们就可以做到平时深藏不露，遇到关键词就毫无征兆地变坏。而且，一旦训练完成，现有的安全策略都毫无办法。 ChatGPT“最强竞对”Claude的背后厂商Anthropic联合多家研究机构发表...

大数据 2024-01-15 人工智能

803阅读

向量数据库：AIGC时代的必备基础工具

今天分享的AIGC系列深度研究报告：《向量数据库：AIGC时代的必备基础工具》。（报告出品方：广发证券）报告共计：47页点击添加图片描述（最多60个字）编辑一、向量数据库为 AI 大模型全生命周期管理提质增效随着AI大模型的...

AIGC 2024-01-15 人工智能

894阅读

AIGC内容分享(十三)：2023年中国AIGC产业全景报告

目录核心摘要中国AIGC产业之“变”与"新技术变革的原始驱力：大模型层价值传递的实际落位：应用层不可忽视的资源引擎：算力层中国AIGC产业之发展趋势核心摘要古人有云：日就月将，学有缉熙于光明。人类对人工智能学的潜心钻研...

生成式AI 2024-01-15 人工智能

913阅读

TimePillars：提升200米以上小目标的检测能力

本文经自动驾驶之心公众号授权转载，转载请联系出处。基于LiDAR点云点3D Object Detection一直是一个很经典的问题，学术界和工业界都提出了各种各样的模型来提高精度、速度和鲁棒性。但因为室外的复杂环境，所以室外点云的Object Det...

大数据 2024-01-15 人工智能

1088阅读

AIGC之Image2Video（一）| Animate Anyone：从静态图像生成动态视频，可将任意图像角色动画化

近日，阿里发布了Animate Anyone，只需一张人物照片，结合骨骼动画，就能生成人体动画视频。项目地址：https://humanaigc.github.io/animate-anyone/ 论文地址：https://ar...

AIGC 2024-01-15 人工智能

1096阅读

AI绘画权益纠纷：你的创作是否触碰了版权底线？

最近，北京互联网法院就一起人工智能生成图片（AI绘画图片）的著作权侵权案进行了首次审理并做出了判决。这是中国首例牵涉到“AI文生图”著作权的案件，庭审过程在多个平台进行直播，吸引了众多网友，同时引发了对于AI生成内容与著作权之间关系的广泛讨论。那么近年...

生成式AI 2024-01-15 人工智能

1001阅读

AI看图猜位置，准确率超90%！斯坦福最新PIGEON模型：40%预测误差不到25公里

随手在网络上发布的一张照片，能暴露多少信息？外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战，网友提供照片，他来猜测照片的具体拍摄地，有些照片甚至还能猜到具体的航班细节。是不是细思极恐？但「照片挑战」也同样抚慰了很多人心中的遗憾，...

生成式AI 2024-01-15 人工智能

1029阅读

一文读懂 LLM 可观测性

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM (大型语言模型可观测性，本文将继续聚焦在针对 LLM 的可观测性进行解析，使得大家能够了解 LLM 的可观测性的必要性以及其核心的生态体系知...

生成式AI 2024-01-15 人工智能

1441阅读

[AIGC] Apache Spark 简介

Apache Spark是一个开源的大数据处理框架，它提供了高效的分布式数据处理和分析能力。Spark通过将数据加载到内存中进行计算，可以大幅提高数据处理速度。以下是Apache Spark的几个基本概念：弹性分布式数据集（RDD）：RDD是Spa...

生成式AI 2024-01-15 人工智能

785阅读

2023AIGC市场研究报告：ChatGPT的技术演进、变革风向与AIGC投资机会分析（附下载链接）...

省时查报告-专业、及时、全面的行研报告库省时查方案-专业、及时、全面的营销策划方案库【免费下载】2023年1月份热门报告合集 ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 ChatGPT使...

AIGC 2024-01-15 人工智能

853阅读

Meta承认使用盗版书籍训练AI：拒绝赔偿作家

快科技1月14日消息，据国内媒体报道，Meta最近因使用数千本盗版书籍训练人工智能模型存在法律风险而引发版权侵权诉讼。据悉，Meta使用大量盗版书籍的Books3”数据集训练其LLAM 1和LLAM 2模型，Meta虽承认使用了 Books3 数据集，却...

大数据 2024-01-14 人工智能

811阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

1223阅读

实战AI大模型：AIGC及经典模型

今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的...

大数据 2024-01-14 人工智能

1209阅读

谷歌AI通过图灵测试，大模型医生来了？GPT-4竟诊断出难倒17个医生的怪病

【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生，通过了图灵测试，再次引领医疗AI的革命。我们需要研发对人类有益AGI的原因之一: OpenAI联创Greg Brockman的一番话点明，当前先进A...

大数据 2024-01-14 人工智能

938阅读

OpenAI的人工智能语音识别模型Whisper详解及使用

1 whisper介绍拥有ChatGPT语言模型的OpenAI公司，开源了 Whisper 自动语音识别系统，OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型，...

生成式AI 2024-01-14 人工智能

3397阅读

大模型应用实践：AIGC探索之旅

随着OpenAI推出ChatGPT，AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势，而是深刻地塑造着我们交流、工作和思考的方式。本文介绍了笔者理解的大模型和AIGC的密切联系，从历史沿革到实际应用案例，再到面临的技术挑战和伦理监管问题...

AIGC 2024-01-14 人工智能

1350阅读

视觉高精地图构建的全面回顾！一起看看无图感知都有哪些落地方案（清华&滴滴）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解近年来，自动驾驶受到越来越多的关注，高精地图成为自动驾驶技术的关键组成部分。这些地图提供了道路网络的复杂细节，并作为车辆定位、导航和决策等关键任务的基本输入。鉴于视觉...

生成式AI 2024-01-14 人工智能

1346阅读

国内多所高校共建开源社区LAMM，加入多模态语言模型大家庭的时候到了

ChatGPT问世以来，大语言模型（LLM）实现了跳跃式发展，基于自然语言进行人机交互的AI范式得到广泛运用。然而，人类与世界的交互中不仅有文本，其他诸如图片、深度等模态也同样重要。然而，目前的多模态大语言模型（MLLM）研究大多数闭源，对高校和大多数研...

大数据 2024-01-14 人工智能

1026阅读

GauHuman开源：基于Gaussian Splatting，高质量3D人体快速重建和实时渲染框架

论文名称：GauHuman: Articulated Gaussian Splatting from Monocular Human Videos 论文下载地址：https://arxiv.org/abs/2312.02973 项目主页：https...

生成式AI 2024-01-14 人工智能

1098阅读

大模型相关技术综述

多模态大模型&大模型训练语料持续迭代已经开始整理多模态-视觉部分：主要分为一下几块多模态信息压缩模型（clip、vit、swiT）生成模型（vae、gan、flow、ddpm、sde... 其它多模态大模型（语音...

AIGC 2024-01-14 人工智能

1147阅读

哪些技术可能会在2024年重塑企业？

过去的2023年，见证了技术的快速发展，这些技术极大地改变了全球政府、公共部门、企业，甚至公众的生活。趋势表明，大型语言模型、元宇宙和生成人工智能中绿色数据中心的采用激增，这成为了人们谈论的话题，并且似乎仍然是人们关注的焦点。现在，更大的问题是，哪些技...

大数据 2024-01-14 人工智能

807阅读

大模型恋爱神器！16种MBTI自由定制，北大ChatLaw团队出品

北大团队新作，让大模型拥有个性! 而且还是自定义那种，16种MBTI都能选。图源备注：图片由AI生成，图片授权服务商Midjourney 这样一来，即便是同一个大模型，不同性格下的回答都不一样。比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...

大数据 2024-01-14 人工智能

926阅读

Stable Diffusion 母公司开源大语言模型，代号「StableLM」！

公众号关注 “GitHubDaily” 设为 “星标”，每天带你逛 GitHub！昨天晚上 11 点，Stable Diffusion 的母公司 Stability AI 重磅宣布，正式开源一款全新的大语言模型：StableLM。...

人工智能 2024-01-14 人工智能

832阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜2＞

3.2 人类反馈强化学习（RLHF） RLHF 是一种模型训练过程，应用于微调的语言模型，以进一步使模型行为与人类偏好和指令遵循保持一致。我们收集代表根据经验采样的人类偏好的数据，人类注释者可以选择他们更喜欢的两个模型输出中的哪一个。这种人类反馈随后用...

大数据 2024-01-14 人工智能

1038阅读

人工智能如何让智慧城市变得更加智慧

佛罗里达州科勒尔盖布尔斯的创新官员正在将 OpenAI 的 ChatGPT 整合到他们现有的聊天机器人中，以改进其响应。该市人工智能数字助理机器人中的机器学习算法使用以 YAML 编写的文件，YAML 是一种用于配置文件的人类可读格式。该市 IT...

AIGC 2024-01-14 人工智能

854阅读

一部iPhone实时渲染300平房间，精度达厘米级别！谷歌最新研究证明NeRF没死

3D实时渲染大型场景，一台电脑，甚至一部手机就可以完成。从家里的客厅到主卧，储物间，厨房，卫生间各个死角，都能逼真在电脑中完成渲染，如同拍摄实物视频一般。而且，你还可以在一台iPhone上完成复杂场景渲染。来自谷歌、谷歌DeepMind和图宾根...

人工智能 2024-01-14 人工智能

960阅读

放射科医生再临危机！国外五大机构联合发布「胸部X光」最新基准

胸部X光（CXR）检查是一种广泛应用于各种疾病的筛查、诊断检查的临床成像方式。临床诊断中，不仅包括常见的疾病类型，往往还会描述相应严重程度和不确定性，目前的医学图像数据库往往满足于预测疾病类型，而忽视了具有重大临床意义的后者。最近，德州州立阿灵顿分校...

大数据 2024-01-14 人工智能

867阅读

LLaMA-v2-Chat vs. Alpaca：应该在什么时候使用不同的人工智能模型？

译者 | 李睿审校 | 重楼如今，大型语言模型（LLM）正在彻底改变人们的工作和生活，从语言生成到图像字幕软件，再到友好的聊天机器人。这些人工智能模型为解决现实世界的问题提供了强大的工具，例如生成聊天响应或遵循复杂的指令。在这篇关于LLaMA v2的...

大数据 2024-01-14 人工智能

965阅读

训练Stable Diffusion(SD) Lora模型巨详细教程赛博丹炉/青龙脚本/秋叶云端使用教程主用赛博丹炉（道玄）巨小白巨啰嗦，全是干货和踩过的坑

前言试了很多的sd训练，尤其是sd的lora的训练，问题一大堆，现在写个博客汇总一下一、一些理论知识记录一些杂七杂八各种博客看到的训练经验。 1. 对于sd1.5训练出来2G左右大小就是有效模型，WebUI默认FP16。【AI绘画】模型...

大数据 2024-01-14 人工智能

5337阅读

大语言模型漏洞缓解指南

虽然大语言模型(LLM 应用正在全球快速普及，但企业对大语言模型的威胁态势仍然缺乏全面了解。面对大语言模型风险的不确定性，企业希望在保障其安全性的基础上加快应用脚步，用人工智能提升企业核心竞争力，这意味着企业的CISO面临着理解和应对新兴人工智能威胁...

大数据 2024-01-13 人工智能

951阅读

新研究：医用AI评估精神分裂新患者治疗效果近乎盲猜

1月12日消息，一项最新研究发现，用于协助医生治疗精神分裂症患者的计算机算法不能很好适应之前开发过程中未见过的新鲜数据。因此这种医用人工智能在评估未曾接触过的患者的治疗效果时，表现十分糟糕。这些医用工具利用人工智能来发现大数据集中的特征，并预测个体对...

AIGC 2024-01-13 人工智能

747阅读

AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.4 -大模型发展历程之多模态）

文章大纲什么是多模态为什么 Transformer 也是多模态模型的基础架构视觉 Transformer 和 Text Transformer 如何结合 - contrastive learning 对比学习 stable diffu...

生成式AI 2024-01-13 人工智能

1111阅读

视频场景图生成任务新SOTA！中山大学提出全新时空知识嵌入框架，登顶刊TIP'24

视频场景图生成（VidSGG）旨在识别视觉场景中的对象并推断它们之间的视觉关系。该任务不仅需要全面了解分散在整个场景中的每个对象，还需要深入研究它们在时序上的运动和交互。最近，来自中山大学的研究人员在人工智能顶级期刊IEEE T-IP上发表了一篇论文...

大数据 2024-01-13 人工智能

845阅读

谷歌MIT最新研究证明：高质量数据获取不难，大模型就是归途

获取高质量数据，已经成为当前大模型训练的一大瓶颈。前几天，OpenAI被《纽约时报》起诉，并要求索赔数十亿美元。诉状中，列举了GPT-4抄袭的多项罪证。甚至，《纽约时报》还呼吁摧毁几乎所有的GPT等大模型。一直以来，AI界多位大佬认为「合成数据」...

人工智能 2024-01-13 人工智能

827阅读

Google Bard 、Bing Copilot 、Claude、文心一言的简介及与ChatGTP异同

本文详细比较了 ChatGTP、Google Bard、Bing Copilot 、 Claude 和文心一言五种文本生成式 AI 。本文共计约 3000字，预计阅读时间为 10-15分钟。 1、ChatGTP 1.1、官网：https://chat....

AIGC 2024-01-13 人工智能

1549阅读

为大模型恶补数学，上交开源MathPile语料库，95亿tokens，还可商用

在当前智能对话模型的发展中，强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库，而如何构建这样的语料库，已成为行业中的一大挑战。在备受瞩目的 AI for Math 领域，由于高质量的数学语料相对稀缺，这限制了生成式...

AIGC 2024-01-13 人工智能

883阅读

Stable Diffusion - 超分辨率插件 StableSR v2 (768x768) 配置与使用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131582734 论文：Exploiting Diffusion...

AIGC 2024-01-13 人工智能

1243阅读

AIGC之论文笔记DALL-E

文章目录 Zero-Shot Text-to-Image Generation 一. 简介二. 方法 2.1. 第一阶段：Learning the visual codebook 2.1.1 回顾VQ-VAE 2.1.2...

生成式AI 2024-01-13 人工智能

951阅读

首个国产开源MoE大模型来了！性能媲美Llama 2-7B，计算量降低60%

开源MoE模型，终于迎来首位国产选手！它的表现完全不输给密集的Llama 2-7B模型，计算量却仅有40%。这个模型堪称19边形战士，特别是在数学和代码能力上对Llama形成了碾压。它就是深度求索团队最新开源的160亿参数专家模型DeepSeek...

大数据 2024-01-13 人工智能

941阅读

为什么人工智能如此需要资源？

截至2023年底，任何关于生成式人工智能需要多少能源的预测都是不准确的。头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万个家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，功率密度将上升到每机架50千瓦或100千...

人工智能 2024-01-13 人工智能

831阅读

快GPT-4 10倍！这款卖疯的AI Agent产品，撼动大模型！

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）现在的大型语言模型（LLM）就像牙膏一样鸡贼，你必须非常用力地挤压（正确地提示）才能得到适量的牙膏（答案）。就像奥特曼形容现在的GPT4一样：“如果你问 GPT-4 大部分...

AIGC 2024-01-13 人工智能

969阅读

Stable Diffusion架构的3D分子生成模型 GeoLDM - 测评与代码解析

之前，向大家介绍过3D分子生成模型 GeoLDM。 GeoLDM按照Stable Diffusion架构，将3D分子生成的扩散过程运行在隐空间内，优化了基于扩散模型的分子生成。可能是打开Drug-AIGC的关键之作。让精确控制分子生成有了希望。...

大数据 2024-01-13 人工智能

1349阅读