-
使用Kohya_ss训练Stable Diffusion Lora
Stable Diffusion模型微调方法 Stable Diffusion主要有 4 种方式:Dreambooth, LoRA, Textual Inversion, Hypernetworks。 Textual Inversion (也称为 Em...
-
基本概念:什么是ChatGPT和AIGC?
1.背景介绍 1. 背景介绍 自2012年的AlexNet成功地赢得了ImageNet Large Scale Visual Recognition Challenge,深度学习技术开始引以为奎。随着算法的不断发展和优化,深度学习技术已经应用...
-
春节大礼包!OpenAI首个视频生成模型发布,60秒高清大作,网友已叹服
欢迎来到 bling zoo! 北京时间今天凌晨,OpenAI 正式发布了文本到视频生成模型 Sora,继 Runway、Pika、谷歌和 Meta 之后,OpenAI 终于加入视频生成领域的战争。 山姆・奥特曼的消息放出后,看到 OpenAI 工程师...
-
如何探索和可视化用于图像中物体检测的 ML 数据
近年来,人们越来越认识到深入理解机器学习数据(ML-data)的必要性。不过,鉴于检测大型数据集往往需要耗费大量人力物力,它在计算机视觉(computer vision)领域的广泛应用,尚有待进一步开发。 通常,在物体检测(Object Detectio...
-
AIGC:使用变分自编码器VAE实现MINIST手写数字生成
1 变分自编码器介绍 变分自编码器(Variational Autoencoders,VAE)是一种生成模型,用于学习数据的分布并生成与输入数据相似的新样本。它是一种自编码器(Autoencoder)的扩展,自编码器是一种用于将输入数据压缩为低维表示并再...
-
AI写作疑似度检测:确保原创性与质量的秘诀
大家好,今天来聊聊AI写作疑似度检测:确保原创性与质量的秘诀,希望能给大家提供一点参考。 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 标题:AI写作疑似度检测:确保原创性与质量的秘诀 随着人工智能技...
-
【AIGC】Stable Diffusion的采样器入门
在 Stable Diffusion 中,采样器(Sampler)是指用于生成图像的一种技术或方法,它决定了模型如何从潜在空间中抽样并生成图像。采样器在生成图像的过程中起着重要作用,影响着生成图像的多样性、质量和创造性。以下是对 Stable Diffus...
-
AIGC智能编程:提升开发效率之利器
1. 引言 随着科技的迅速发展,人工智能在各个领域都得到了广泛的应用。在软件开发领域,AIGC(Artificial Intelligence Generated Code)智能编程已经成为一种热门的技术。AIGC智能编程利用人工智能算法和机器学习模型...
-
AI大模型学习笔记之四:生成式人工智能(AIGC)是如何工作的?
OpenAI 发布 ChatGPT 已经1年多了,生成式人工智能(AIGC)也已经广为人知,我们常常津津乐道于 ChatGPT 和 Claude 这样的人工智能系统能够神奇地生成文本与我们对话,并且能够记忆上下文情境。 Midjunery和DALL·...
-
使用deepspeed继续训练LLAMA
目录 1. 数据训练配置 2. 模型载入 3. 优化器设置 4. DeepSpeed 设置 5. DeepSpeed 初始化 6. 模型训练 LLAMA 模型子结构: 1. 数据训练配置 利用 PyTorch 和 Transfo...
-
LLaMA 入门指南
LLaMA 入门指南 LLaMA 入门指南 LLaMA的简介 LLaMA模型的主要结构 Transformer架构 多层自注意力层 前馈神经网络 Layer Normalization和残差连接 LLaMA模型的变体 Base版本 La...
-
科技部出手!科研人员的 AIGC 使用手册来了,学术界开始防范 AI 枪手
篡改实验数据、实验图片造假、论文不当署名、教材编写抄袭……1 月 16 日下午,华中农业大学的 11 名学生「一纸诉状」,以一份 125 页的举报材料实名举报该校黄姓教授存在学术不端行为。一时间,舆论迅速发酵,「赌上前程捍卫学术清白」、「人人都是学术造假受...
-
八项指标对比ChatGPT和文心一言
文章目录 前言 特定指标对比: 实际运用对比: 一、算力 二、训练时间 三、算法复杂度 四、模型结构 五、应用场景 六、性能指标 七、可解释性 八、迁移能力 ✍创作者:全栈弄潮儿 ? 个人主页: 全栈弄潮儿的个人主页 ?️ 个人...
-
AIGC总体相似度是什么意思
大家好,今天来聊聊AIGC总体相似度是什么意思,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:AIGC总体相似度:一篇深入解析的文章 随着人工智能技术的飞速发展,AIGC(人工智能生成...
-
ChatGPT和Whisper的API基本看点
ChatGPT Official API Learning 今天 OpenAI 开放了 ChatGPT 背后的 GPT-3.5 的模型 API,模型代号为 Turbo,其定价甚至比此前的 Davinci 都要便宜,1000 tokens 仅为 0.2...
-
每日一看大模型新闻(2023.12.13)趣味项目CLoT:训练LLM更幽默地回答问题;用RLHF 2%的算力让LLM停止有害输出,字节提出LLM遗忘学习;2.7B能打Llama 2 70B,微软祭出
1.产品发布 1.1 2.7B能打Llama 2 70B,微软祭出「小语言模型」 发布时间:2023-12-13 2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini na...
-
ChatGPT与文心一言:智能回复与语言准确性的较量
在当今数字化时代,随着人们对智能化技术的需求不断增长,智能回复工具也成为了日常生活中不可或缺的一部分。ChatGPT和文心一言作为两个备受瞩目的智能回复工具,在智能回复、语言准确性以及知识库丰富度等方面各有卓越之处。 本文将对这两者进行全面比较,并深入探...
-
Amazon Code Whisperer 的正式使用,全新 AI 代码工具等你发现!(内附详细安装步骤图解)
文章作者:稚始稚终 关于 Code Whisperer Code Whisperer,亚马逊推出的实时 AI 编程助手,是一项基于机器学习的服务,它可以分析开发者在集成开发环境(IDE)中的注释和代码,并根据其内容生成多种代码建议。 开发者可以用...
-
使用midjourney搞出一套三国人物画像!
当下已进入如火如荼的全民AI时代,最近体验了下midjourney,使用它的以图生图功能生成出来一套三国人物画像,和大家分享下使用心得。 使用midjourney的准备工作 下载工具 使用midjourney生产图片依赖的工具和流程,大致...
-
ChatGPT.vs.文心一言,到底谁更好用?
引言: 随着人工智能技术的不断发展,自然语言处理模型也在不断进步。两个备受关注的模型是OpenAI的ChatGPT和文心一言。ChatGPT是基于GPT-3.5架构的大型语言模型,而文心一言则是一款专注于生成短文本的AI模型。本文将探讨这两个模型的特点、...
-
上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务
本文首发于微信公众号 CVHub,未经授权不得以任何形式售卖或私自转载到其它平台,违者必究! Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...
-
AI视频年大爆发!Gen-2/Pika成时代爆款,2023年AI视频生成领域的现状全盘点
【新智元导读】2023年,也是AI视频元年。过去一年究竟有哪些爆款应用诞生,未来视频生成领域面临的难题还有哪些? 过去一年,AI视频领域我们见证了,Gen-2、Pika等爆款产品的诞生。 来自a16z的Justine Moore,详细盘点了人工智能视频生成...
-
AIGC从入门到精通
目录 1. 概述 2. 一键起飞 2.1 webui 2.2 基础用法 2.3 必装插件 2.4 Fooocus 2.5 diffusers 3 LoRA 3.1 原理 3.2 训练流程和准备 3.3 上手训练...
-
羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读
论文地址:https://arxiv.org/pdf/2307.09288.pdfd 代码地址:GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model...
-
GitHub Copilot 与 ChatGPT:哪种工具更适合软件开发?
GitHub Copilot 与 ChatGPT:哪种工具更适合软件开发? 比较 ChatGPT 与 GitHub Copilot 编程语言 功能性 定制化 训练数据 上下文准确性 ChatGPT 与 GitHub Copilot:哪个更适...
-
AI新工具(20240203) 文心一言APP数字分身;HuggingChat Assistants等
文心一言APP数字分身-一键生成专属数字分身 文心一言数字分身是一项新功能,用户只需一张照片和录制三句语音,就能创建一个专属的数字分身。这个数字分身还支持个性化定义名称、声音、MBTI性格等,用户可以选择是否公开自己的数字分身。这个功能的上线大大缩短...
-
详解各种LLM系列|LLaMA 1 模型架构、预训练、部署优化特点总结
作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』,加入 NewBee讨论组 LLaMA 是Meta在2...
-
AIGC 语言大模型研究报告
AIGC 研究报告 这份报告可以被划分为两大部分。 第一部分集中于ChatGPT的发展和运作原理,为了增强理解,我们将先探讨自然语言处理的历史发展。 第二部分主要聚焦于由大模型引领的新的研究领域,并深入介绍在每个领域中可以进行的具体研究工作及思...
-
如何使用AIGC进行图像生成和编辑
1.背景介绍 图像生成和编辑是计算机视觉领域的重要应用,随着人工智能技术的发展,AIGC(Artificial Intelligence Generative Convolutional 已经成为了图像生成和编辑的主流方法。在本文中,我们将详细介...
-
中文LLaMa和Alpaca大语言模型开源方案 | 扩充中文词表 & 针对中文语料进行高效编码
欢迎关注『CVHub』官方微信公众号! Title: Efficient and Effective Text Encoding for Chinese Llama and AlpacaPDF: https://arxiv.org/pdf/23...
-
AIGC内容分享(五十七):AIGC:合规引领探索之路
目录 引言 01 资质合规 02 内部合规管理体系及制度 03 互联网应用关键条款完善 04 外部商业合作 结语 引言 从GPT 3.5的问世、GPT4.0的革新到Google最近推出的Gemini系列原生多模态AI基础模型,生成式人...
-
stable diffusion微调总结
stable diffusion微调总结 stable diffusion 模型类别: SD SD2 SDXL SDXL LCM(潜在一致性模型) SDXL Distilled SDXL Turbo 安装accelerate 通过pip...
-
目前使用AIGC技术的公司或项目及经验教训
目前使用AIGC技术的公司或项目及经验教训 人工智能生成代码(AIGC)技术正在改变软件开发的面貌。许多公司和项目已经开始采用这项技术,以提高开发效率和代码质量。本文将探讨一些使用AIGC技术的公司或项目,并分享它们的经验教训。 使用AIGC技术的...
-
零基础看懂免费开源的Stable Diffusion
文章目录 前言 Diffusion模型 推理过程 训练过程 Stable Diffusion模型 参考 前言 前面一篇文章主要讲了扩散模型的理论基础,还没看过上篇的小伙伴可以点击查看:DDPM理论基础。这篇我们主要讲一下一经推...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
全网最全stable diffusion模型讲解!快来!!小白必收藏!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取) AI模型最新展现出的图像生成能力远远超出人们的预期...
-
Stable Diffusion 基本原理
1 Diffusion Model的运作过程 输入一张和我们所需结果图尺寸一致的噪声图像,通过Denoise模块逐步减少noise,最终生成我们需要的效果图。 图中Denoise模块虽然是同一个,但是它会根据不同step的输入图像和代表noise严重程...
-
无需RLHF显著提升GPT-4/Llama2性能,北大团队提出Aligner对齐新范式
背景 大语言模型(LLMs)虽展现出了强大的能力,但也可能产生不可预测和有害的输出,例如冒犯性回应、虚假信息和泄露隐私数据,给用户和社会造成伤害。确保这些模型的行为与人类意图和价值观相对齐,是一个紧迫的挑战。 尽管基于人类反馈的强化学习(RLHF)提供了...
-
文心一言 使用指南
文心一言快速入门指南,只要3步 第一步:不要“学”,直接拿来用 刚开始一个月,尽量让自己每天玩10次文心一言。把自己工作、生活中遇到的问题,随手记录下来,扔给文心一言,看看它有什么建议。大约大半个月后,会逐渐发现文心一言的迷人之处。这个时候...
-
三个Agent顶个GPT-4,基于开源小模型的那种
真·“三个臭皮匠,顶个诸葛亮”—— 基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果! 话不多说,直接来看两个系统执行记录。 用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。于是指定模型使用Deezer和Shazam的API...
-
吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。 前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,...
-
7B开源数学模型干翻千亿GPT-4,中国团队出品
7B开源模型,数学能力超过了千亿规模的GPT-4! 它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。 无需借助任何外部工具,它就能在竞赛水平的MATH数据集上达到51.7%的准确率。 在开源模型中,它第一个在该数据集上...
-
RMBG-1.4官网体验入口 AI高效准确分割图像前后背景免费在线使用地址
RMBG-1.4是一个用于图像背景去除的Pytorch模型,由BRIA AI开发。经过专业级数据集的训练,能够高效准确地分割前景和背景。该模型的精度、效率和通用性目前可与领先的开源模型媲美,适用于支持企业大规模内容创作的商业使用案例。由于使用了合法许可的训...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...
-
大语言模型之LlaMA系列- LlaMA 2及LLaMA2_chat(上)
LlaMA 2是一个经过预训练与微调的基于自回归的transformer的LLMs,参数从7B至70B。同期推出的Llama 2-Chat是Llama 2专门为对话领域微调的模型。 在许多开放的基准测试中Llama 2-Chat优于其他开源的聊天模型,此外...
-
探索AI绘画:如何让算法创作美画
1.背景介绍 随着人工智能技术的不断发展,我们已经看到了许多令人惊叹的应用,例如自动驾驶、语音助手、图像识别等。在艺术领域,人工智能也开始发挥着重要作用,尤其是在绘画领域。AI绘画是一种通过算法和机器学习技术创作艺术作品的方法,它旨在让计算机或机...
-
MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身...
-
AI破译2000年前「上古卷轴」登Nature头版!21岁计算机天才,谷歌华人工程师共获大奖
2000年前碳化的古卷轴,如今成功被AI破译!背后三人团队还拿下70万美元大奖! AI在考古领域的重大进步,甚至登上了今天Nature的头版。 要说这件事的起源,还得追溯到公元79年一次火山爆发, 直接将一座珍藏古老的纸莎草卷轴——Herculaneu...
-
挖掘BEV潜力的边界!DA-BEV:无监督BEV SOTA新方案!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 今天和大家探讨3D视觉感知领域中的一个特定问题:针对纯视觉的鸟瞰图(BEV)的无监督领Domain Adaptation(Unsupervised Domain Ad...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...