数据集第54页 - AIGC资讯

LCM：大大加快生成高质量图像的新方法

作者丨Mike Young 译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）图片得益于一种名为潜在一致性模型（LCM）的新技术，文本转换成图像的AI即将迎来重大飞跃。潜在扩散模型（LDM）等传统方法在使用...

人工智能 2023-11-30 人工智能

863阅读

谷歌 DeepMind 研究人员使用 AI 工具发现 200 万种新材料

Google DeepMind 的研究团队通过人工智能工具 GNoME 发现了 220 万种理论上稳定但实验上未实现的晶体结构，这一成果在《自然》杂志上发表。这一发现的晶体结构数量是科学史上发现的数量的 45 倍以上，为可再生能源和先进计算等领域的发展提供...

AIGC 2023-11-30 人工智能

619阅读

聊一聊大模型 | 京东云技术团队

事情还得从ChatGPT说起。 2022年12月OpenAI发布了自然语言生成模型ChatGPT，一个可以基于用户输入文本自动生成回答的人工智能体。它有着赶超人类的自然对话程度以及逆天的学识。一时间引爆了整个人工智能界，各大巨头也纷纷跟进发布了自家的大模...

生成式AI 2023-11-30 人工智能

663阅读

22LLMSecEval数据集及其在评估大模型代码安全中的应用：GPT3和Codex根据LLMSecEval的提示生成代码和代码补全，CodeQL进行安全评估【网安AIGC专题11.22】

LLMSecEval: A Dataset of Natural Language Prompts for Security Evaluations 写在最前面主要工作课堂讨论大模型和密码方向（没做，只是一个idea）相关研究提示集目...

人工智能 2023-11-30 人工智能

931阅读

开源生成式AI初创平台together.ai融资7.3亿元

Together AI，一家专注于生成式人工智能（AIGC）领域的初创平台，宣布在A轮融资中获得7.3亿元人民币，由凯鹏华盈领投，英伟达等多家公司跟投。 Together AI强调开源在大模型领域的重要性，发布了多个备受好评的开源产品，包括类ChatGPT...

大数据 2023-11-30 人工智能

762阅读

使用 RLHF 训练 LLaMA 的实践指南：StackLLaMA

由于LLaMA没有使用RLHF，后来有一个初创公司 Nebuly AI使用LangChain agent生成的数据集对LLaMA模型使用了RLHF进行学习，得到了ChatLLaMA模型，详情请参考：Meta开源的LLaMA性能真如论文所述吗？如果增加RLH...

人工智能 2023-11-30 人工智能

840阅读

【AI绘画】云服务器部署stable-diffusion-webui保姆级教程

1.背景之前给大家写过Mac苹果笔记本上部署stable-diffusion-webui的教程，知乎链接：【奶奶看了也不会】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程但是安装过程就花了一天的时间，各种问...

生成式AI 2023-11-29 人工智能

889阅读

AI测试｜史上最全，细数AIGC在测试领域落地的困难点

一、引言&背景自2022年由横空出世的ChatGPT引发的各类AIGC（Generative AI）爆发以来，人们对其在各个领域的应用潜力产生了极大的兴趣。在研发领域，各种研究已经证明了Github Copilot在研发效能提高上的积极作用。...

AIGC 2023-11-29 人工智能

1243阅读

北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人

近日，北京大学和中山大学等机构的研究者提出了一种名为Chat-UniVi的视觉语言大模型，实现了统一的视觉表征，使其能够同时处理图片和视频任务。这一框架的独特之处在于，它不仅在深度学习任务中表现卓越，而且仅需短短三天的训练时间，就能够训练出具有130亿参数...

大数据 2023-11-29 人工智能

697阅读

GenAI安全：如何防止Microsoft Copilot发生数据泄露

微软的Copilot被称为世界上最强大的生产力工具之一。 Copilot是一个AI助手，它位于你的每个Microsoft 365应用程序中-Word、Excel、PowerPoint、Teams、Outlook等。微软的梦想是从日常工作中解脱出来，让...

AIGC 2023-11-29 人工智能

873阅读

机器学习中常用的几种回归算法及其特点

回归是统计学中最有力的工具之一，机器学习监督学习算法分为分类算法和回归算法两种。回归算法用于连续型分布预测，可以预测连续型数据而不仅仅是离散的类别标签。在机器学习领域，回归分析应用非常广泛，例如商品的销量预测问题，交通流量预测问题、预测房价、未来的天气...

生成式AI 2023-11-29 人工智能

816阅读

AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合预演“下个浪潮”

收集整理|小鱼新的AI题材层出不穷，这次轮到“机器人+AI"融合而成的具身智能概念。 “硅谷钢铁侠"马斯克和热爱黑色皮衣的"显卡教父”黄仁勋均作出积极表态，可谓不谋而合。当地时间5月16日，特斯拉2023年年度股东大会召开，马斯克在会，...

AIGC 2023-11-29 人工智能

753阅读

北大最新多模态大模型开源：在混合数据集上训练，无需修改直接用到图像视频任务

训完130亿参数通用视觉语言大模型，只需3天！北大和中山大学团队又出招了——在最新研究中，研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架，可以大大减少VLM（视觉语言大模型）在训练和推理过程中的开销。具体而言，团队按照提出的新框架...

人工智能 2023-11-29 人工智能

728阅读

AI视野：Stability.ai开源SDXL Turbo；Pika Labs1.0版发布；字节跳动ChitChop在海外上线；Keras3.0正式发布；法院判决AI生成图片具备版权

???AI应用 Stability.ai发布开源文生图模型SDXL Turbo 文生成图AI平台Stability.ai发布开源SDXL Turbo，图像生成实时响应，仅需1秒。SDXL Turbo基于全新对抗扩散蒸馏技术（ADD），将生成步骤减至1-4步...

大数据 2023-11-29 人工智能

783阅读

中国团队开源大规模高质量图文数据集ShareGPT4V

中国团队最近开源了一个引人瞩目的图文数据集，命名为ShareGPT4V，它基于GPT4-Vision构建，训练了一个7B模型。这一举措在多模态领域取得了显著的进展，超越了同级别的模型。该数据集包含了120万条图像-文本描述数据，涵盖了世界知识、对象属性、...

大数据 2023-11-29 人工智能

794阅读

训练130亿大模型仅3天，北大提出Chat-UniVi统一图片和视频理解

论文地址：https://arxiv.org/pdf/2311.08046.pdf GitHub 地址：https://github.com/PKU-YuanGroup/Chat-UniVi Huggingface 地址：https://huggi...

人工智能 2023-11-29 人工智能

714阅读

研究人员发布Starling-7B：基于AI反馈的大语言模型媲美GPT-3.5

UC伯克利的研究人员最近发布了Starling-7B，这是一款基于AI反馈强化学习（RLAIF）的开放式大语言模型(LLM 。该模型基于精调的Openchat3.5，并继承了Mistral-7B的特性。在RLAIF中，研究人员借助其他AI模型的反馈来训练...

AIGC 2023-11-29 人工智能

740阅读

伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练

加州大学伯克利分校的研究人员推出了一款名为Starling-7B的开放式大型语言模型（LLM），采用了一种称为Reinforcement Learning from AI Feedback(RLAIF 的创新训练方法。 RLAIF的独特之处在于利用其他人...

大数据 2023-11-29 人工智能

718阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1326阅读

人工智能十大基础术语

这里有10个关键的术语，每个人工智能爱好者都应该知道并了解。人工智能(AI 已经成为各行各业的变革力量，塑造了我们与技术和周围世界互动的方式。对于那些深入人工智能领域的人而言，理解基础术语至关重要。 1、人工智能(AI ：人工智能的核心是指开发能够执...

大数据 2023-11-29 人工智能

721阅读

Stable Diffusion - ControlNet 插件中扩展局部重绘 InpaintOnly + LaMa 算法与应用

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/131643131 LaMa: https://github.com...

AIGC 2023-11-29 人工智能

1072阅读

处理海量数据：Java与MySQL大数据处理的技巧

处理海量数据是现代应用程序中常见的挑战之一，尤其是在Java与MySQL这样的技术栈中。下面将介绍一些处理海量数据的技巧和策略，并讨论如何通过Java与MySQL实现高效的大数据处理。一、基础概念和挑战处理海量数据涉及到大量的存储和计算资源，因此需要...

人工智能 2023-11-29 人工智能

773阅读

【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总

网安AIGC专题写在最前面一些碎碎念课程简介 0、课程导论 1、应用 - 代码生成 2、应用 - 漏洞检测 3、应用 - 程序修复 4、应用 - 生成测试 5、应用 - 其他 6、模型介绍 7、模型增强 8、数据集 9、模型安全...

大数据 2023-11-29 人工智能

750阅读

Copilot 工作原理

Copilot 是如何工作的？它的背后算法是什么？ Copilot 的工作原理可以大致分为两个阶段：第一阶段是从海量代码库中抽取出有效的代码段和语句，这些代码段用于训练AI模型；第二阶段则是谷歌的自然语言处理技术和深度神经网络技术，将文本解析成进一步的代...

人工智能 2023-11-29 人工智能

916阅读

AIGC零基础30天学习——CLIP模型

1. 模型架构 Contrastive Language-Image Pre-training（以下简称“CLIP”）是OpenAI 在 2021 年初发布的用于匹配图像和文本的预训练神经网络模型，可以说是近年来在多模态研究领域的...

生成式AI 2023-11-29 人工智能

1052阅读

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

AIGC 2023-11-29 人工智能

916阅读

当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍

目录模型生成效果展示（prompt 全公开）如何注册 Stable Diffusion 使用 SD（dreamstudio.ai ）的收费标注如何 SD 提供哪些参数可以设置如何使用种子来改进一张作品我用 SD 创作的图片著作权如何归属...

生成式AI 2023-11-28 人工智能

1144阅读

Llama-Factory的baichuan2微调

Llama-Factory：https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。默认模块应作...

人工智能 2023-11-28 人工智能

1085阅读

由18个国家支持的AI安全指南发布

英国国家网络安全中心(NCSC 发布了新的指导方针，可以帮助AI系统的开发者和提供商“建立按预期运行的AI系统，在需要时可用，并且在不向未经授权的各方泄露敏感数据的情况下工作。” 如何将网络安全置于AI系统的核心安全AI系统开发指南涵盖了ML应用程序...

AIGC 2023-11-28 人工智能

681阅读

AIGC之GPT-4：GPT-4的简介与详细攻略

AIGC之GPT-4：GPT-4的简介与详细攻略简介欢迎来到人工智能生成内容（AIGC）时代的新篇章！本篇博客将介绍GPT-4（Generative Pre-trained Transformer 4）的核心原理、意义、亮点、技术点、缺点以及使...

人工智能 2023-11-28 人工智能

1110阅读

网络安全人工智能：将人工智能纳入安全策略

人工智能已被广泛应用于各种情况，以提高生产力、增加销售或改善用户体验。人工智能应用仍处于起步阶段的一个领域是网络安全。快速演变的威胁形势当黑客实施欺诈和造成伤害的能力比以往任何时候都更加复杂时，如果想保持领先地位，利用每一个工具是最重要的。此外，由...

大数据 2023-11-28 人工智能

631阅读

大模型之Bloom&LLAMA----RHLF(强化学习)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

大数据 2023-11-28 人工智能

808阅读

全球首份《AI系统安全开发准则》发布，提出4方面安全监管要求

2023年11月26日，美国、英国、澳大利亚等18个国家的网络安全监管部门联合发布了全球首份《AI系统安全开发准则》，旨在实现保护人工智能模型不被恶意篡改，并敦促人工智能公司在开发或使用人工智能模型时更加关注“设计安全”。作为这份准则制定的主要参...

人工智能 2023-11-28 人工智能

755阅读

一个提示，让Llama 2准确率飙至80.3%？Meta提出全新注意力机制S2A，大幅降低模型幻觉

2023的科技界，可以说是被大模型抢尽了风头（虚假的室温超导除外）。我们经历了和LLM对话，见证了它们逐渐进入各个领域，甚至开始感受到威胁。这一切，仅仅发生在一年之内。当然了，基于大语言模型的原理，它诞生之时就有的一些毛病到现在也没有完全改正。比...

大数据 2023-11-28 人工智能

824阅读

规模小、效率高：DeepMind推出多模态解决方案Mirasol 3B

多模态学习面临的主要挑战之一是需要融合文本、音频、视频等异构的模态，多模态模型需要组合不同来源的信号。然而，这些模态具有不同的特征，很难通过单一模型来组合。例如，视频和文本具有不同的采样率。最近，来自 Google DeepMind 的研究团队将多模态...

生成式AI 2023-11-28 人工智能

736阅读

稳定的音频来了 — 使用人工智能创作音乐（for free）

今天，以稳定扩散（Stable Diffusion）和StableLM等开源AI工具和模型而闻名的Stability AI公司推出了其首个音乐和声音生成AI产品——StableAudio。音乐产业以其难以打入而闻名。即使您拥有才华和动力，您仍然需要创作和...

人工智能 2023-11-28 人工智能

980阅读

用趋动云GPU部署自己的Stable Diffusion

注：本文内容来自于对DataWhale的开源学习项目——免费GPU线上跑AI项目实践的学习，参见：Docs，引用了多处DataWhale给出的教程。 1.创建项目 1）进入趋动云用户工作台，在当前空间处选择注册时系统自动生成的空间（其他空间无免费算力）...

人工智能 2023-11-28 人工智能

739阅读

AI训练中的缺陷：算法决策或成为未来生活的威胁

近期由多伦多大学和麻省理工学院的计算机科学家团队进行的实验发现，当前AI模型的设计存在严重问题，可能给人类带来灾难性后果。这是因为使用描述性标签训练的AI系统往往做出比人类更为苛刻的决定。随着AI已经广泛渗透到我们生活的方方面面，如语音助手提醒、健康机器...

AIGC 2023-11-28 人工智能

743阅读

在少样本学习中，用SetFit进行文本分类

译者 | 陈峻审校 | 重楼在本文中，我将向您介绍“少样本（Few-shot）学习”的相关概念，并重点讨论被广泛应用于文本分类的SetFit方法。传统的机器学习（ML）在监督（Supervised）机器学习中，大量数据集被用于模型训练，以便...

人工智能 2023-11-28 人工智能

802阅读

Stable Diffusion - 常用的负向提示 Embeddings 解析与坐姿 (Sitting) 提示词

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132145248 负向 Embeddings 是用于提高 Stable...

生成式AI 2023-11-28 人工智能

1873阅读

GitHub Copilot 快速入门

GitHub Copilot 是 AI 结对程序员。可以使用 GitHub Copilot 在编辑器中获取整行或整个函数的建议。 1. 简介让我们首先了解一些关于 GitHub Copilot 的内容。这是 GitHub 和 OpenAI 的合作...

AIGC 2023-11-28 人工智能

1078阅读

【城南】如何识别AI生成图？视觉AIGC伪造检测技术综述

图片无法加载可参考阅读：知乎文章 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ry2Qw8uO-1685675351028 (https://r3mu87a8e6.feishu.cn/space/api/box/stre...

大数据 2023-11-27 人工智能

771阅读

景联文科技：一文读懂火爆全网的AIGC和背后的数据标注技术！

“在过去的几个月中，AIGC发展速度惊人，DALL-E、Midjourney和Stable Diffusion等技术的快速发展，创作出了许多由AI生成的艺术品。本文中，我们将为您阐述AIGC技术和背后所涉及的数据标注技术。" 今年八月，美国的一位39...

大数据 2023-11-27 人工智能

673阅读

谷歌和微软联手培养AI未来：推出面向初学者的入门课程

近期，谷歌和微软联手推动人工智能（AI）领域的军备竞赛迈向教育行业，分别发布了针对初学者的AI入门课程。这标志着人工智能不仅仅是科技领域的竞争，也成为培养下一代科学家、思想家和AI领袖的教育重点。首先，谷歌携手Raspberry Pi基金会推出了名为「E...

大数据 2023-11-27 人工智能

718阅读

DALLE2论文解读及实现(一)

DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents paper: https://cdn.openai.com/papers/dall-e-2.pdf githu...

人工智能 2023-11-27 人工智能

910阅读

IDEA提出ToG思维图谱大模型性能提升214%！

近期，由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术，在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型（LLM）与知识图谱(KG ，成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。...

大数据 2023-11-27 人工智能

1049阅读

比尔盖茨：GPT-5不会比GPT-4好多少，生成式AI已达到极限

比尔·盖茨一句爆料，成为机器学习社区热议焦点： “GPT-5不会比GPT-4好多少。” 虽然他已不再正式参与微软的日常运营，但仍在担任顾问，并且熟悉OpenAI领导团队的想法。消息来自德国《商报》（Handelsblatt）对盖茨的采访。盖茨表示，...

生成式AI 2023-11-27 人工智能

634阅读

谷歌：LLM找不到推理错误，但能纠正它

今年，大型语言模型（LLM）成为 AI 领域关注的焦点。LLM 在各种自然语言处理（NLP）任务上取得了显著的进展，在推理方面的突破尤其令人惊艳。但在复杂的推理任务上，LLM 的表现仍然欠佳。那么，LLM 能否判断出自己的推理存在错误？最近，剑桥大学和...

人工智能 2023-11-27 人工智能

652阅读

单个A100生成3D图像只需30秒，这是Adobe让文本、图像都动起来的新方法

2D 扩散模型极大地简化了图像内容的创作流程，2D 设计行业也因此发生了变革。近来，扩散模型已扩展到 3D 创作领域，减少了应用程序（如 VR、AR、机器人技术和游戏等）中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型，生成具有评分蒸馏采样（S...

大数据 2023-11-27 人工智能

766阅读

南洋理工推80亿参数多模态大模型OtterHD

最近，南洋理工华人团队提出的80亿参数多模态大模型 OtterHD 引起了人们的关注。与其他模型相比，OtterHD 具有处理高分辨率图像的能力，并且具有通用性，能够应对各种推理需求。团队通过在 Fuyu-8B 上进行指令微调，并使用 FlashAtten...

大数据 2023-11-27 人工智能

654阅读