-
Qwen2——阿里巴巴最新的多语言模型挑战 Llama 3 等 SOTA
引言 经过几个月的期待, 阿里巴巴 Qwen 团队终于发布了 Qwen2 – 他们强大的语言模型系列的下一代发展。 Qwen2 代表了一次重大飞跃,拥有尖端的进步,有可能将其定位为 Meta 著名的最佳替代品 骆驼3 模型。在本次技术深入探讨中,我...
-
游戏工厂:AI(AIGC/ChatGPT)与流程式游戏开发
游戏工厂:AI(AIGC/ChatGPT)与流程式游戏开发 码客 卢益贵 ygluu 关键词:AI(AIGC、ChatGPT、文心一言)、流程式管理、好莱坞电影流程、电影工厂、游戏工厂、游戏开发流程、游戏架构、模块化开发 一、前言 开发周期长、人工...
-
AI作画算法详解:原理、应用与未来发展
随着人工智能技术的不断发展,AI作画逐渐成为了一个热门话题。AI作画,即利用人工智能算法生成绘画作品,不仅仅是技术的展示,更是艺术与科技结合的创新体现。本文将深入探讨AI作画的核心算法原理,并通过实例帮助读者更好地理解和掌握这一技术。 文章最后,给大家推...
-
AI绘画杀死了设计师!?恰恰相反……
与大多数人想象的不同,ChatGPT等各种AI工具爆火之后,受到冲击最大的居然是设计师、作家、翻译等具有创造性的工作,以体力劳动为主的蓝领反而最不易被替代。 以城市数据团做过的一项研究为例,他们对中国1639种职业进行了GPT替代风险分析,下面是数据...
-
推荐开源项目:Whisper - 实时语音转文本的利器
推荐开源项目:Whisper - 实时语音转文本的利器 1、项目介绍 Whisper 是一个由 OpenAI 制作的开源项目,它提供了一个强大的工具,能够将音频转换为文本。该项目基于 whisper.cpp 并利用 FFMPEG 进行音频格式转换,可以...
-
AI绘画变现之MJ制作表情包(附教程)
前期构思: ●主题:明确表情包的主题,例如快乐或悲伤、卡通人物或的动物等; ●形象:描述表情包中角色的外貌特征,例如发型、着装、配饰等; ●表情和动作:描述角色的表情和动作,例如微笑、大笑、哭泣、生气、难过、眨眼等; ●背景和场景:建议尽量使用白色...
-
stable diffusion 的controlNet 安装和使用
stable diffusion 安装controlNet需要先下载扩展 扩展地址 下载了扩展以后,需要下载相应的模型,每个模型大约1.45G,可以按需下载。模型地址 如果下载速度太慢,可以考虑去liblib下载,但是是全量模型liblib 模型下载...
-
OpenAI面临监管部门调查:因涉嫌限制员工举报安全隐患
快科技7月14日消息,据媒体报道,OpenAI因涉嫌使用限制性保密协议 (NDA 限制员工发声而再次受到审查。 据媒体报道,OpenAI被曝强制员工签署所谓的过度限制性”协议,此举严重阻碍了员工揭露公司技术可能带来的潜在风险与危害。 这起事件的导火索是一...
-
[AI 大模型] 百度 文心一言
文章目录 [AI 大模型] 百度 文心一言 简介 模型架构 发展 新技术和优势 API 代码示例 [AI 大模型] 百度 文心一言 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DwAIh0...
-
从头开始学习扩散模型 Stable Diffusion
今天我们来揭开 Stable Diffusion 技术的神秘面纱。 1.稳定扩散原理 Stable Diffusion 在2022年发表,一种基于Latent Diffusion Models的新兴机器学习技术。它基于扩...
-
AIGC从入门到实战:安装权重文件和 LoRa 模型文件
1. 背景介绍 1.1 AIGC 的兴起与发展 近年来,人工智能生成内容(AIGC)技术取得了显著的进步,其应用范围也日益广泛,涵盖了图像生成、文本创作、音频合成、视频制作等众多领域。AIGC 的兴起得益于深度学习技术的突破,特别是生成对抗网络(GAN...
-
Stable Diffusion【3D模型】:场景精细与逼真,人物表情丰富的3D大模型AWPoly3D(附模型包)
今天和大家分享一个基于SD1.5的3D大模型:AWPoly3D。该模型是AWP系列的3D大模型,此模型的人物是基于阿里巴巴旗下的“堆友”开源Avatar作为数据集训练的,生成的人物具有非常明显的辨识度。也可以用来制作3D icon,3D场景,也非常推荐使用...
-
【愚公系列】软考高级-架构设计师 112-信息物理系统
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
Stable Diffusion WebUI详细使用指南
Stable Diffusion WebUI(AUTOMATIC1111,简称A1111)是一个为高级用户设计的图形用户界面(GUI),它提供了丰富的功能和灵活性,以满足复杂和高级的图像生成需求。由于其强大的功能和社区的活跃参与,A1111成为了Stabl...
-
突破AI性能瓶颈 揭秘LLaMA-MoE模型的高效分配策略
获取本文论文原文PDF,请在公众号【AI论文解读】留言:论文解读 本文介绍了一种名为“LLaMA-MoE”的方法,通过将现有的大型语言模型(LLMs)转化为混合专家网络(MoE),从而解决了训练MoE时遇到的数据饥饿和不稳定性问题。该方法基于著名的LLa...
-
AIGC从入门到实战:ChatGPT 说自己能做什么?
背景介绍 随着人工智能技术的不断发展,自然语言处理(NLP)技术也取得了显著的进展。近年来,生成对抗网络(GAN)和序列模型(Seq2Seq)等技术的发展,使得机器学习和深度学习在语言模型方面取得了突破性进展。其中,OpenAI的ChatGPT模型是目前...
-
AI绘画Stable Diffusion 超高分辨率扩图教程:ControlNet组件-Tile妙用,增强细节保持构图完整!
大家好,我是向阳 今天给大家分享如何用AI绘画工具Stable Diffusion 的 ControlNet Tile工具应用。ControlNet Tile模型能够在SD绘图过程中,实现高分辨率下实现高清扩图,并且避免出现图像分身现象,以及可以调整SD...
-
赵明:荣耀手机端侧AI远远领先所有 有的品牌只会平移别人的
快科技7月13日消息,昨天下午荣耀Magic V3正式发布,首发AI离焦护眼技术以及干眼友好绿洲护眼技术。 这些技术能智能识别干眼风险并主动调节,缓解视觉疲劳,号称开启功能阅读25分钟后,可短暂性近视指标平均降低13度。 很多手机都在做AI,荣耀的AI有...
-
100% 压榨 GitHub Copilot 指南
大家好,我是楷鹏。 早在 OpenAI 推出 ChatGPT 之前,OpenAI 就已经和 GitHub 合作推出了 GitHub Copilot。 下文统一简称 Copilot Copilot 当时在编程圈引起轰动。 当时激进的说法是:...
-
规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果...
鱼羊 明敏 发自 凹非寺量子位 | 公众号 QbitAI 本周国内最受关注的AI盛事,今日启幕。 活动规格之高,没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流,李开复与...
-
用Copilot画漫画,Luma AI生成视频:解锁创意新玩法
近年来,随着人工智能技术的不断发展,各种创意工具也层出不穷。今天,我们就来介绍一种全新的创作方式:使用Copilot画漫画,再将漫画放入Luma AI生成视频。 Copilot:你的AI绘画助手 Copilot是一款基于人工智能的绘画工具,它可以帮助你...
-
AI战火烧至短剧!抖音快手抢先开打,带来哪些启示?
AI再度“爆改”短剧。 近日,抖音、快手纷纷上线了各自的AI短剧,凭借堪比大片的画面和质感,在行业内引发热议。两大平台背后的AI视频生成产品——即梦和可灵,也成为了焦点。 AI究竟会如何影响短剧行业?对于短剧从业者而言,AI是蜜糖还是砒霜? 抖音快手瞄准A...
-
【Llama 2的使用方法】
Llama 2是Meta AI(Facebook的母公司Meta的AI部门)开发并开源的大型语言模型系列之一。Llama 2是在其前身Llama模型的基础上进行改进和扩展的,旨在提供更强大的自然语言处理能力和更广泛的应用场景。 以下是Llama 2的一...
-
搭建本地whisper语音识别
目录 代码仓库 编辑 选择模型 环境配置 语音识别测试 Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 代码仓库 GitHub - ope...
-
调研分析:LLama大模型
1. 引言 在当前的自然语言处理(NLP)研究中,大规模预训练模型如BERT、GPT-3和RoBERTa已经展示了其卓越的性能和广泛的应用。随着技术的发展,新的模型不断涌现,推动了NLP领域的持续进步。本文将聚焦于LLama模型,分析其结构、预训练策略、优...
-
【从0到1 在AMD显卡的win上安装stable-diffusion】
摘要: 终于换了台电脑了,这太电脑32G运行内存,4G核显(想买有独显的,不过好贵哦),AMD R7 8核处理器。看着这么高的配置,心有点痒痒的,不能浪费了这个配置呀,哈哈,于是就有了安装Stable-Diffusion的想法。 安装步骤: 1...
-
Stable Diffusion / huggingface 相关配置问题汇总
目录 1 `OSError: Can't load tokenizer for 'openai/clip-vit-large-patch14'.` 报错 解决方法 方法1——手动下载 方法2——自动下载 其他方法(待研究) 2 `hug...
-
unity 接入百度API——AI作画
完整代码下载地址:https://download.csdn.net/download/weixin_43703390/89179785 打不开就是还在审核中… 账号注册创建模块: 1.打开百度智能云官网:[https://cloud.baidu.c...
-
探索大模型:袋鼠云在 Text To SQL 上的实践与优化
Text To SQL 指的是将自然语言转化为能够在关系型数据库中执行的结构化查询语言(简称 SQL)。近年来,伴随人工智能大模型技术的不断进步,Text To SQL 任务的成功率显著提升,这得益于大模型的推理、理解以及指令遵循等能力。 对于大数据平台...
-
Midjourney prompts 怎么写?怎么优化?
作者先说:这几天想系统整理下mj知识体系,从这篇开始都是对阅读官方文档后的个人解读,跳过了官方的quick start和Community guidelines,从prompt开始写起。才疏学浅,如有错误或更好的方法,拜托大家指正 什么是Prompt?...
-
18个月326项能力,这家大厂猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了
构建生成式 AI 应用,现在只需要几分钟。 「生成式 AI 的半衰期只有六个月,」亚马逊云科技全球 AI 产品副总裁 Matt Wood 说道。 2024开启下半年,人们发现,生成式技术和落地之间的距离,已经不能用「远」或「近」完全概括。 狂热的百模大战之...
-
NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM的原理和差异有哪些-详细解读
自然语言处理(NLP)领域的多个大型语言模型(如GPT-3、ChatGPT、T5、PaLM、LLaMA和GLM)在结构和功能上有显著差异。以下是对这些模型的原理和差异的深入分析: GPT-3 (Generative Pre-trained Transf...
-
#13 在Web项目中集成Stable Diffusion的指南
文章目录 前言 1. 集成前的准备 1.1 确定需求 1.2 环境搭建 2. 集成步骤 2.1 后端集成 2.2 前端集成 3. 优化与测试 3.1 性能优化 3.2 功能测试 4. 安全与隐私 4.1 数据保护 4.2 安全措...
-
[AIGC] 图论基础入门
图论是数学的一个分支,旨在研究图(graph)的属性和应用。这是一个跨学科领域,因为图论可以用于描述和解决各种实际问题。如社交网络分析,电脑网络,生物网络等。 文章目录 什么是图? 图的基本性质 LeetCode 图论相关问题解析及...
-
Llama-factory源码详细解读
微调 采用逐行调试的方法,细节来看SFT代码 AutoModelForCausalLM...
-
【AIGC半月报】AIGC大模型启元:2024.06(下)
AIGC大模型启元:2024.06(下) (1 Gen-3 (2 Open-Sora 1.2(Open-Sora再升级) (3 Claude 3.5 Sonnet(Claude升级) (4 ChatTTS v3(ChatTTS升级) (...
-
AI自学超越人工标注训练,蚂蚁数科2篇自监督学习论文入选国际顶会
近日,蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议(ECCV)”和“国际机器学习大会(ICML ”,可实现无需人工打标数据的情况下,通过自监督学习、强化学习等方法训练模型输出可信结果。据悉,两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域...
-
AI日报:阿里又推王炸级对口型项目EchoMimic;三星推Galaxy Ring智能戒指;高保真3D头像生成模型RodinHD
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、AI对口型项目EchoMimi...
-
解决Excel客户端中的Copilot灰色不可用
很多小伙伴已经用上了office套件中的copilot功能 Copilot for Microsoft 365账号介绍与相关问题的解答 Copilot for Microsoft 365账号登录指南 Copilot for Microsoft 365...
-
快速LLaMA:面向大型语言模型的查询感知推理加速 论文摘要翻译与评论
论文摘要翻译与评论 论文标题: QuickLLaMA: Query-aware Inference Acceleration for Large Language Models 提出的框架 我们Q-LLM框架的示意图。来自记忆上下文的输入被...
-
史上最「蠢」AI凶手?剧本杀被人类一秒揪出,开发者小哥紧急调教
【新智元导读】AI剧本杀,开本了!最近,两位开发者在黑客马拉松期间创作了一款AI游戏「山庄谋杀案」,我们需要和五位AI嫌疑人对话,揪出真正的凶手。没想到,小编一番试玩后,结局出乎意料…… 想玩剧本杀但凑不齐人发车? 别苦恼了!可以和AI一起博弈破案了,人机...
-
大模型真的在吞噬人类的一切数据吗?
在弗兰克·赫伯特的《沙丘》中,沙漠星球厄拉科斯的沙丘下隐藏着一种无价之宝:香料。 这种神秘物质使太空旅行成为可能,能延长寿命,并具有扩展意识的效果,是宇宙中最宝贵的财富。“谁控制了香料,谁就控制了宇宙”。正如香料在《沙丘》宇宙中占据着至关重要的地位一样,在...
-
在亚马逊云科技AWS上利用SageMaker机器学习模型平台搭建生成式AI应用(附Llama大模型部署和测试代码)
项目简介: 接下来,小李哥将会每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案,帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践,并应用到自己的日常工作里。本次介绍的是如何在Amazon SageMaker上...
-
「AIGC」AIGC行业现在适合进入吗
AIGC行业现在适合进入吗 AIGC行业展现出巨大的发展潜力和商业价值,但同时也面临技术发展和商业化进程的不确定性、版权和伦理问题等挑战。如果你对AIGC技术持续感兴趣,并且愿意适应行业的快速变化,现在可能是进入该行业的一个好时机。不过,需要对行...
-
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来
刚刚过去的2024年3月,OpenAI最强人工智能(AI)大模型GPT-4发布了一周年,对于生成式 AI 的热度只增不减。 过去一个月内,OpenAI、谷歌、微软、英伟达、阿里等多家国内外大科技公司均发布多个关于 AI 的重要消息,动作不断,全球最强...
-
AI绘画Stable Diffusion | 如何利用SD垫图实现动漫真人互转,教程照片风格转换
“ 小红书上有很多用AI做卡通头像的,大概思路是你拍一张个人照片发给博主,博主利用midjourney的垫图功能转换成卡通形象,一张收取一定费用……” 稍微了解AI绘画的人都应该知道,midjourney是付费的软件,而且需要一定魔法上网能力。 今天...
-
押宝AI功能!苹果将iPhone 16系列出货量计划提高10%:至少9000万台
快科技7月11日消息,据macrumors报道,苹果已经将2024年iPhone 16系列的出货量预期提升到9000万台,相比iPhone 15系列同期提高10%。 这背后主要得益于苹果对Apple Intelligence的信心,苹果认为该功能会显著增强...
-
使用LlamaFactory进行模型微调:参数详解
在深度学习和自然语言处理领域,模型微调是提升预训练模型性能的重要手段。本文将介绍如何使用LlamaFactory进行模型微调,并详细解析一些关键参数,包括 --cutoff_len 1024、--flash_attn auto、--lora_rank 8、...
-
[大模型]Llama-3-8B-Instruct FastApi 部署调用
环境准备 在 Autodl 平台中租赁一个 3090 等 24G 显存的显卡机器,如下图所示镜像选择 PyTorch-->2.1.0-->3.10(ubuntu22.04 -->12.1。 接下来打开刚刚租用服务器的 JupyterL...
-
电商内容科技的未来:AIGC推动品牌创意智能化
什么是电商内容的数字化? 电商内容数字化指的是把内容从生产-管理-发布上架的流程变得更数字化、自动化、更便捷。电商是这十几年发展很快的渠道,过去电商传播内容的方式都是通过文案,现在有图片、长图文、UGC、短视频。对于品牌来说,电商内容数字化是品牌要不断适...