训练数据第28页

为什么知识管理是 AI 成功的基础？

为 AI 提供正确的上下文可以提高准确性并减少幻觉。在所有关于人工智能如何彻底改变工作（使日常任务更高效、更可重复，并增加个人努力）的对话中，人们很容易得意忘形：人工智能不能做什么？尽管它的名字叫生成式人工智能，但能够创建图像、代码、文本、音乐...

人工智能 2023-11-21 人工智能

940阅读

研究人员使用特殊图像“毒害”人工智能

DALL-E、Midjourney和Stable Diffusion等人工智能生成艺术工具的兴起引发了激烈的辩论和争议。这些系统可以通过在互联网上收集的大量数据集上进行训练，简单地根据文本提示创建真实感图像和艺术。然而，这引发了人们对侵犯版权、滥用艺术家...

人工智能 2023-11-21 人工智能

807阅读

AI写作助手

在计算机科技瞬息万变的时代，人工智能 (AI 已经成为了日常生活的一部分，尤其是在文本生成和自然语言处理方面。华丽的明珠之一就是OpenAI的GPT-4，一个能够体验多种写作情景的AI写作助手。本文将深入探讨GPT-4的特点，优势，局限性以及如何使用它，...

生成式AI 2023-11-21 人工智能

1070阅读

OpenAI大洗牌？创始人Sam Altman 加入 Microsoft ？ChatGPT或许成为开源项目?

就在科技界因 OpenAI 创始人兼首席执行官被解雇的惊人消息而震动两天后，又传来了另一个重磅炸弹：萨姆·奥尔特曼 (Sam Altman 和格雷格·布罗克曼 (Greg Brockman 决定加入微软。虽然我觉得这个决定无异于搬起石头砸自己的脚。在...

人工智能 2023-11-21 人工智能

916阅读

基于llama模型进行增量预训练

目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...

生成式AI 2023-11-21 人工智能

1293阅读

Grounding dino + segment anything + stable diffusion 实现图片编辑

目录总体介绍总体流程模块介绍目标检测： grounding dino 目标分割：Segment Anything Model (SAM 整体思路模型结构：数据引擎图片绘制集成样例其他问题附录总体介绍...

生成式AI 2023-11-21 人工智能

2038阅读

大语言模型之七- Llama-2单GPU微调SFT

（T4 16G）模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener...

人工智能 2023-11-21 人工智能

1029阅读

Stable Diffusion XL训练LoRA

主要包括SDXL模型结构，从0到1训练SDXL以及LoRA教程，从0到1搭建SDXL推理流程。【一】SDXL训练初识 Stable Diffusion系列模型的训练主要分成一下几个步骤，Stable Diffusion XL也不例外：训练集...

AIGC 2023-11-20 人工智能

1309阅读

AI「cosplay」关键在人设！复旦、人大等发布大五人格+MBTI测试：特质还原率达82.8%，拒绝OOC

想和喜欢的动漫小说角色聊天？想要一个虚拟伴侣？想要自己的数字智能体？随着大语言模型（Large Language Models, LLM）的发展，这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...

大数据 2023-11-20 人工智能

1285阅读

Omniverse Replicator环境配置和使用说明

Omniverse Replicator使用说明本教程将介绍Omniverse Replicator的环境配置和使用说明, 参加Sky Hackathon的同学可以参考本教程来合成训练数据集. 文章目录 Omniverse Repl...

大数据 2023-11-20 人工智能

1197阅读

【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」

ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案中...

AIGC 2023-11-20 人工智能

1854阅读

OpenAI安全系统负责人长文梳理：大模型的对抗攻击与防御

随着 ChatGPT 的发布，大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源，研究如何在对齐过程中为模型构建默认的安全行为。但是，对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。目前在对抗攻击...

生成式AI 2023-11-20 人工智能

1154阅读

GPT-4V在自动驾驶上应用前景如何？面向真实场景的全面测评来了

GPT-4V 的发布让许多计算机视觉（CV）应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。最近，一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...

人工智能 2023-11-20 人工智能

805阅读

智能自动化：当计算机视觉、人工智能和AR集成时

智能自动化是一个相当新的概念，各行业尚未与其业务整合。本文讨论了构成智能自动化的几个关键点。对于开发人员而言，最有前途的技术是增强现实(AR 、虚拟现实(VR 和人工智能(AI 。虚拟现实(VR 是由游戏玩家为游戏玩家开发的，主要用于游戏和娱乐，而...

AIGC 2023-11-20 人工智能

827阅读

复旦、人大等发布大五人格+MBTI测试角色扮演AI特质还原率达82.8%

近期，由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性，特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...

AIGC 2023-11-20 人工智能

890阅读

自动驾驶中基于深度学习的预测和规划融合方法综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。 Rethinking Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A...

生成式AI 2023-11-20 人工智能

907阅读

效果超越SDXL！港中大博士生推出超真实人像合成工具，训练用了3.4亿张图

为了让AI画出的人更加逼真，港中大博士生用了3.4亿张图像专门训练画人。人物的表情、姿态，环境的空间关系、光线都能合理布局，可谓立体感十足。就连爆火的SDXL也不是它的对手，话不多说，直接上图！这个模型的名字叫HyperHuman，主打的就是一个...

AIGC 2023-11-20 人工智能

847阅读

百度文心一言怎么样？

文心一言在3月16号发布，刚发布时只有邀请码体验，没有申请体验通道。到了晚上看到申请体验通道，便提交了申请，到4月1号过了半个月终于收到短信可以体验了。本来想看看接口，也没什么恶意，但是却遭到了拒绝，感觉是小心翼翼，生怕泄露了什么。另外...

AIGC 2023-11-20 人工智能

1000阅读

SDXL-Stable Diffusion改进版

文章目录 1. 摘要 2. 算法： 2.1 结构： 2.2 微小的条件机制 2.3 多宽高比训练 2.4 改进自编码器 2.5 所有组合放到一起 2.6 主流方案比较 3. 未来工作 4. 限制论文：《SDXL: Improv...

大数据 2023-11-19 人工智能

1346阅读

掌握AI助手的魔法工具：解密Prompt（提示）在AIGC时代的应用「上篇」

在当今的AIGC时代，我们面临着越来越多的人工智能技术和应用。其中一个引人注目的工具就是Prompt（提示）。它就像是一种魔法，可以让我们与AI助手进行更加互动和有针对性的对话。那么，让我们一起来了解一下Prompt，它是什么，为什么需要它，怎么使用它以及...

生成式AI 2023-11-19 人工智能

820阅读

AIGC：【LLM（一）】——LoRA微调加速技术

文章目录一.微调方法 1.1 Instruct微调 1.2 LoRA微调二.LoRA原理三.LoRA使用一.微调方法 Instruct微调和LoRA微调是两种不同的技术。 1.1 Instruct微调 Instr...

AIGC 2023-11-19 人工智能

1681阅读

大模型「幻觉」，看这一篇就够了

大模型“幻觉”，终于有系统综述了！一口气49页，详细阐述了幻觉定义、分类、导致幻觉的原因，还有检测幻觉、减轻幻觉的方法。这篇最新综述来自哈工大和华为，一po出就在网上火得不行：具体来说，文中用一套新的范畴框架来定义模型幻觉，并将其分为事实性幻觉、...

AIGC 2023-11-18 人工智能

1025阅读

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷，并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...

人工智能 2023-11-18 人工智能

913阅读

13B模型全方位碾压GPT-4？这背后有什么猫腻

一个参数量为 13B 的模型竟然打败了顶流 GPT-4？就像下图所展示的，并且为了确保结果的有效性，这项测试还遵循了 OpenAI 的数据去污方法，更关键的是没有发现数据污染的证据。如果你细细查看图中的模型，发现只要带有「rephraser」这个单词...

大数据 2023-11-18 人工智能

837阅读

基于文档的智能问答系统

基于文档的问答系统（Document-Based Question Answering System）是一种自然语言处理技术，用于回答用户提出的问题。它的原理是通过分析文档中的内容，提取出与用户问题相关的信息，并将其转换成可回答问题的格式。 ChatGP...

人工智能 2023-11-18 人工智能

828阅读

文心一言、讯飞星火与GPT-4/3.5在回答中文历史问题的表现

最近，随着备受关注的文心一言正式免费向全社会开放，再次引起了社会层面对国产大模型的兴趣。以文心一言为代表的国产大模型性能究竟如何？如果将它们相互比较，并且和GPT系列模型等国际前沿水平的LLM进行比较，会得到什么样的结果呢？笔者对此...

人工智能 2023-11-17 人工智能

1130阅读

OpenAI CEO和马斯克在线互怼：Grok真能叫板GPT-4吗？

最近，科技界的两大顶流——OpenAI CEO和马斯克“掐”起来了。事情的起因是，Sam Altman发了一条推文，说“GPTs可以节省很多工作”，配图充满嘲讽意味，直指马斯克的AI聊天机器人Grok。他让GPT Builder创建一个聊天机器人，以...

人工智能 2023-11-17 人工智能

1194阅读

Insight量子位智库 ✪ AIGC/Al生成内容产业展望报告

AIGC全称为 Al-Generated Content，指基于生成对抗网络GAN、大型预训练模型等人工智能技术，通过已有数据寻找规律，并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media，合成式媒体，主要指基...

大数据 2023-11-17 人工智能

944阅读

让Ai帮你工作（4）--锁定图片生成角色

背景： Gpt4多模态模型上来后，MJ也是紧接着发布了V5，微软发布自己Ai作图工具，Abode、unity这些传统老牌作图软件工具也是紧跟着发布自己的AI作图插件工具。这已经标志着Ai作图已经成为计算成像的另一条生成链。各大厂都已经发布了...

AIGC 2023-11-17 人工智能

928阅读

【NLP】Llama & Alpaca大模型

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

生成式AI 2023-11-17 人工智能

859阅读

一文盘点2023人工智能进展，不止大模型而已

2023年大模型千帆竞发，除此外AI领域还有哪些新突破？来来来，畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。看完才知道： RLHF今年虽然爆火，但实打实用到的模型并不多，现在还出现了替代方案，有望从开...

AIGC 2023-11-16 人工智能

919阅读

IBM 推出 Watsonx.Governance，帮助企业和政府建立对生成式AI的信任

IBM 近日宣布将于12月初正式推出 watsonx.governance 工具包，该工具包旨在帮助企业和政府在生成式人工智能模型中建立更多的信任，消除数据输入和输出的不确定性。虽然基于大型语言模型或基础模型的生成式人工智能为企业提供了许多用例，但同时...

AIGC 2023-11-16 人工智能

866阅读

CVPR 2023 | 去雨去噪去模糊，图像low-level任务，视觉AIGC系列

Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能，因为它们可以对重要的非局部信息进行建模，这对...

生成式AI 2023-11-16 人工智能

919阅读

Altman首次自曝GPT-5加急训练中！暗示比GPT-4更复杂，无法预测真实能力

「OpenAI正在开发下一代大模型GPT-5。我们的意义所在，就是打造超凡脱俗的神奇AI智能」。这是Sam Altman最近接受FT的一次采访中，首次对外透露了更多OpenAI的计划。这篇文章信息量巨大！他不仅谈到了OpenAI的融资想法，英伟达...

大数据 2023-11-16 人工智能

807阅读

ChatGPT代码生成飙升10%！北大华人一作：细化prompt，大幅改进大模型代码能力

在大模型时代，高质量的代码生成已经强大到，让人惊叹。从通过HumEval中67%测试的GPT-4，到近来各种开源大模型，比如CodeLlama，有望成为码农编码利器。然而，现实中，程序员们不会精炼表达需求，因此误导、限制了LLM生成优秀代码的能力。...

生成式AI 2023-11-16 人工智能

976阅读

一招分辨刷榜作弊大模型，博士小哥开源AI数学“照妖镜”

如今很多大模型都声称擅长数学，谁有真才实学？谁是靠背测试题“作弊”的？有人在今年刚刚公布题目的匈牙利全国数学期末考试上做了一把全面测试。很多模型一下子就“现原形”了。先看绿色部分，这些大模型在经典数学测试集GSM8k和全新卷子上取得的成绩差不多，...

生成式AI 2023-11-16 人工智能

888阅读

戳穿人工智能的六个谎言：辨别真伪

译者 | 布加迪审校 | 重楼人工智能（AI）无疑是我们这个时代的流行语。特别是随着ChatGPT等生成式AI应用程序的出现，AI大受欢迎，成为了技术大辩论的核心话题。所有人都在谈论像ChatGPT这样的生成式AI应用程序的影响以及利用它们的能力...

大数据 2023-11-16 人工智能

799阅读

AIGC入门 - LLM 信息概览

在阅读本文之前，建议阅读文章：《GPT，GPT-2，GPT-3，InstructGPT的进化之路》本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...

大数据 2023-11-16 人工智能

1133阅读

微调Whisper语音识别模型和加速推理

前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文。本项目主要的目的是为了对W...

生成式AI 2023-11-16 人工智能

1339阅读

AIGC视频生成/编辑技术调研报告

人物AIGC：FaceChain人物写真生成工业级开源项目，欢迎上github体验。简介：随着图像生成领域的研究飞速发展，基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天，视频生成/编辑技术也引起了学术界和产...

大数据 2023-11-15 人工智能

1086阅读

Google Bard VS ChatGPT：哪个是更好的AI聊天机器人？

文章目录前言一、Bard和ChatGPT的宏观对比二、应用场景不同三、知识的时效性四、未来的归宿总结前言自从 OpenAI 向公众发布ChatGPT以来的过去几个月里，我们都见证了围绕 ChatGPT 的各种测评...

人工智能 2023-11-15 人工智能

1155阅读

不是LlaMa套壳！李开复麾下大模型陷套壳争议，团队二次回应来了！

整理丨诺亚、小欧出品 | 51CTO技术栈（微信号：blog51cto）昨天科技圈社区Hacker News突然出现一则消息，矛头直指不久前发布的大模型Yi-34B，认为其除了两个张量被重新命名外，完全使用了Llama的架构。图片而根据公开信息，...

AIGC 2023-11-15 人工智能

844阅读

解释：生成式 AI的工作机制与差异

像 ChatGPT 这样强大的生成式 AI 系统是如何工作的，它们与其他类型的人工智能有何不同？快速浏览一下头条新闻，就会发现生成式人工智能如今无处不在。事实上，其中一些标题实际上可能是由生成式人工智能撰写的，例如 OpenAI 的 ChatGPT，...

AIGC 2023-11-15 人工智能

962阅读

LLM幻觉问题全梳理！哈工大团队50页综述重磅发布

幻觉，老朋友了。自打LLM进入我们的视野，幻觉问题就一直是一道坎，困扰着无数开发人员。当然，有关大语言模型幻觉的问题已经有了无数研究。最近，来自哈工大和华为的团队发表了一篇50页的大综述，对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。这...

AIGC 2023-11-15 人工智能

781阅读

IBM 推出 Watsonx.governance 以提升企业 AI 模型透明度和治理能力

IBM 今日宣布，旗下产品 Watsonx.governance 将于 12 月初正式面市，旨在帮助企业提升对人工智能模型的透明度，消除数据中的神秘面纱。在大型语言模型（LLM）或基础模型的推动下，生成式人工智能为企业带来诸多用途，但同时也引发新的风险...

生成式AI 2023-11-15 人工智能

823阅读

Ghostbuster：一个准确度高的AI生成文本检测工具

大语言模型如ChatGPT，以其卓越的写作能力引发了问题。学生们纷纷利用这些模型代写作业，导致一些学校不得不采取禁止ChatGPT的措施。此外，这些模型还存在生成带有事实错误的文本的倾向，因此谨慎的读者可能想知道，在信任某些新闻文章或其他来源之前，是否有生...

生成式AI 2023-11-15 人工智能

860阅读

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目，和大家分享一下。先把地址po出来。项目名称：中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs 项目地址：https://...

生成式AI 2023-11-15 人工智能

826阅读

GitLab推出对话式AI工具Duo Chat 提升开发效率

在软件开发中，开发人员在处理复杂代码或高效管理项目问题时经常面临挑战。在工作流中找到正确的信息和协助可能是一项难题。为了解决这个问题，GitLab推出了一款名为Duo Chat的新工具，旨在通过将对话式AI整合到现有工作流中简化开发体验。过去，开发人员已...

大数据 2023-11-14 人工智能

939阅读

GPT-5 正在开发中！OpenAI：希望微软能再给资金支持

今年6月，OpenAI CEO Sam Altman 在印度经济时报主办的一场会议上表示:“在我们开始训练下一代模型之前，我们还有很多工作要做。我们正在研究我们认为需要的新想法，但我们肯定还没有准备好开始。” 仅时隔半年后，在OpenAI刚带来全新的GPT...

生成式AI 2023-11-14 人工智能

839阅读

研究: AI生成的白人面孔现在“比真人还真”

根据《心理科学》杂志的一份报告，人工智能（AI）生成的白人面孔的图像如今已经达到了“超真实”的水平，甚至比真实人物的照片更加逼真。然而，该研究指出，由于算法训练数据的偏见，AI在呈现其他族裔的面孔时却表现出明显的白人特征。图源备注：图片由AI生成，图片...

AIGC 2023-11-14 人工智能

819阅读