-
探讨AIGC的发展现状以及趋势(2024)
目录 1. AIGC发展现状 2. 技术应用 3. 未来趋势 1. AIGC发展现状 AIGC(Artificial Intelligence in Games and Creativity,游戏与创意中的人工智能)技术的发展现状...
-
微调LLama模型:具体步骤与代码实现
微调LLama模型是一个涉及多个步骤的过程,包括数据准备、模型加载、设置优化器和损失函数、训练循环以及模型评估。下面,我们将详细介绍这些步骤,并给出相应的代码实现。 步骤一:数据准备 首先,我们需要准备用于微调的数据集。这通常包括一个输入文本序列和对...
-
有哪些好的 Stable Diffusion 提示词(Prompt)可以参考?
看完这八种“提示词”种类,你也会Ai高质量出图! 作为一个老法师,Prompt需要我们自己搜集,然后总结。很多人习惯于通过教程和模型来学习绘画,沿着别人预设的轨道前行,这样一开始没有错,但是长久缺乏自主思考和创造的能力,机械式的学习方式只会限制个人的表达...
-
马斯克的Grok已经可以在xAI网站上单独访问
马斯克开发的Grok现在已经可以在xAI网站上单独访问。这个工具在xAI平台上的功能比之前在推特上展示的版本更加丰富。特别值得一提的是它的分支树模式,这个模式允许用户观察多轮对话中可能产生的不同回答路径,这对于分析和理解对话流程非常有用。 如果你对使用Gr...
-
AI绘图stable diffusion comfy ui的问题
这个是一个blender的节点方式运行comfy ui,但是出现了下面这个问题 (路径不含空格和中文,显卡1060/cpu7700hq) BlenderAI_Node Launch Time: 0.7201s BlenderAI_Node Re...
-
三星在新款 OLED 游戏显示器上增加 AI 图像升级功能
三星推出了一款全新的 OLED 游戏显示器,名为32英寸 Odyssey OLED G8,售价为 $1,299.99。这款显示器的型号为 G80SD,是三星首款搭载人工智能的游戏显示器,采用了与其最新推出的2024款 Neo QLED8K 电视相同的 NQ...
-
在VS中使用Github Copilot心得
环境 周末在家里尝试了在Visual Studio 2022中按装了Github Copilot.首先我将VS 升级到了最新版本,然后在插件市场按装了Copilot.然后关联了GITHUB的账户,同时激活了Copilot. 这个是收费的。 使用心得...
-
Midjourney 参数详解(MJ参数)
官方地址: Midjourney Parameter ListParameters are added to a prompt to change how an image generates. Parameters can change an imag...
-
SD有了这8个插件,stable diffusion才真的是无敌存在!
在AI绘画领域,Stable Diffusion(SD)绝对是设计师和艺术家们最爱用的工具之一。它给设计师们带来了无限的创作灵感,不管是数字艺术、概念设计还是角色建模,都能让设计师们受益匪浅,大大提高他们的出图效率,确保他们的作品在市场上脱颖而出。 所以...
-
CVPR 2024 | 前沿而相对小众!几个AIGC扩散模型diffusion应用一览
1、机器人规划/智能决策 SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution 扩散...
-
Stable Diffusion 入门实操篇
一、了解 SD 与哩布哩布 1. SD简介 SD全称为 Stable Diffusion,与 Midjourney(MJ)一样,也是一款AI绘画软件,SD 的核心原理是潜在扩散模型(LDM),通过该技术,SD能够将原始图像转化为噪声图像,然后逐渐去...
-
24年最新版AI绘画工具ComfyUI整合包一键安装,解压即用!
大家好,我是画画的小强 今天我们带来了ComfyUI 的整合安装包安装教程,可以创建工作流一键生成图片。如果你是一个AI绘画初学者,建议先学习Stable Diffusion-> AI绘画Stable Diffusion零基础入门安装、使用、介绍教...
-
LlamaFactory源码解析 PPO
class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...
-
苏妈杀疯了:移动端最强NPU算力达50TOPS,最强AI芯片挑战英伟达
一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台,其中当属英伟达和 AMD 最为亮眼。英伟达现场拿出了量产版 Blackwell 芯片,还公布了未来三年的产品路线,包括下一代 Rubin AI 平台。 AMD 当然也不甘示弱,CE...
-
斯坦福回应抄袭清华系大模型:将撤下所有模型
近日,斯坦福大学AI研究团队的Llama3-V开源模型因抄袭指控被推上风口浪尖。该模型被指涉嫌抄袭清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V2.5,这一事件迅速在网络上引发广泛关注和热议。 事件的起因在于,斯坦福AI...
-
被作者删库的Llama 3-V原文再现!效果匹敌GPT4-V,训练费用暴降,区区不到500 美元,尺寸小100 倍,如何做到的
编译 | 言征 作者 | Aksh Garg 备注:发稿前作者已经删掉原文 出品 | 51CTO技术栈(微信号:blog51cto) 近日,一款Llama3V最近被“先红后黑”的出了圈。作为全球顶尖研究学府的团队,身陷“抄袭”中国大模型的泥潭后,火速删稿...
-
快手、字节“妙鸭化”,AI图像应用还能再度出圈吗?
在文生图领域,快手也开大了。 据“头号AI玩家”了解,自研文生图大模型“可图”(Kolors)已于近日面向公众开放,用户可通过“可图大模型”微信小程序和网页版使用。 体验链接:https://kolors.kuaishou.com/ 小程序搜索:可图大模...
-
我用LLaMA大模型开发了一个聪明又温柔的智能客服机器人——她的名字叫“云云”
1、非常现实的问题 像绝大多数小型科技公司一样,作为一家中关村里的软件企业,我们的产品定位清晰、目标客户明确,在自己擅长的领域持续研发和耕耘,拥有了一定规模的用户群。 在公司发展的近10年时间里,我和我的同事共接待了近万名客户,这些客户有的购买了我们的...
-
文心一言指令详解及实例分析
一、引言 文心一言,作为人工智能领域的杰出代表,以其独特的自然语言处理能力和广泛的应用场景,受到了广泛的关注。 文心一言指令,作为其核心功能之一,允许用户通过自然语言与文心一言进行交互,实现信息的查询、生成、理解和推理。 本文将详细介绍文心一言指...
-
什么是LLM大模型训练,详解Transformer结构模型
本文分享自华为云社区《LLM 大模型学习必知必会系列(四 :LLM训练理论篇以及Transformer结构模型详解》,作者:汀丶。 1.模型/训练/推理知识介绍 深度学习领域所谓的“模型”,是一个复杂的数学公式构成的计算步骤。为了便于理解,我们以一...
-
Stable Diffusion 安装教程(附安装包) 【SD三种安装方式,Win+Mac一篇文章讲明白】
“Stable Diffusion的门槛过高、不会安装?没关系,这篇文章教会你如何安装!”(文末扫码可直接获取免费安装包~) Stable Diffusion的安装部署其实并不困难,只需简单点击几下,几分钟就能安装好,不管是windows还是苹果mac电...
-
AI日报:AMD向英伟达亮剑推出最强AI芯片;斯坦福AI团队承认抄袭国产大模型;suno将推“哼歌”功能;昆仑万维开源2千亿稀疏大模型天工MoE
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、挑战英伟达!AMD亮出旗下最强...
-
多模态模型学会打扑克:表现超越GPT-4v,全新强化学习框架是关键
只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策! 这种方法得到的模型,已经学会了看图玩扑克、算“12点”等任务,表现甚至超越了GPT-4v。 图片 这是来自UC伯克利等高校最新提出的微调方法,研究阵容也是相当豪华: 图灵奖三巨头之一、M...
-
训练Stable Diffusion(XL) Lora的图片是否需要caption?
intro 目前很多风格lora模型的训练都会对图片进行caption,训练风格lora时使用image caption步骤是否能带来正向的效果? 在sdxl的代码实现中,lora插入的位置为unet中cross attention的QKV的线性投影部...
-
Ilya离开后,8位OpenAI新安全与保密委员会领军人物,你认识几位?
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI宣布成立新的安全与保密委员会,该委员会负责OpenAI项目和运营中的关键决策制定,这引发了互联网的广泛讨论,因为CEO山姆·阿尔特曼(Sam Altman)也是委员会成...
-
LeCun新作:分层世界模型,数据驱动的人型机器人控制
有了大模型作为智能上的加持,人型机器人已然成为新的风口。 科幻电影中「安能辨我不是人」的机器人似乎已经越来越近了。 不过,要想像人类一样思考和行动,对于机器人,特别是人型机器人来说,仍是个艰巨的工程问题。 就拿简单的学走路来说,利用强化学习来训练可能会演...
-
AI如何帮助提取图片中的颜色代码?AI提取图片代码的步骤是什么?
什么是 AI提取图片代码? AI提取图片代码是指使用人工智能技术,特别是图像处理和机器学习算法,来自动识别和提取图片中的颜色信息,将其转换为可用的颜色代码,如RGB或十六进制代码。 AI提取图片代码的核心功能 1:自动颜色识别,AI能够识别图片中的主要...
-
ChatGPT4o被越狱了,有人拿来搞大尺度!
你好啊,我是轩辕。 大家知道,为了防止AI被用于不法用途,各家的AI大模型都设置了一些安全防护措施。 当你尝试让AI去做一些可能涉及到违法的事情时,它会直接拒绝。 图片 然鹅,信息技术的发展总伴随着安全攻防对抗的产生,AI也不例外。 这不,现在就有这么一...
-
OpenAI衍生公司人工智能模型 让机器人像人一样思考、学习
OpenAI曾于2021年夏天宣布解散其机器人团队,原因是缺乏足够的数据来训练机器人使用人工智能进行移动和推理。但三位来自OpenAI的早期研究科学家创立的初创公司Covariant,声称已经解决了这一难题。 Covariant AI系统的特点: 结合...
-
这款AI产品为你提供一个游戏搭子,用Agent的方式在《我的世界》挖钻石
AI will completely reshape how games are played and made. The future is one where game creation is democratized, and makers are...
-
AmbientGPT有哪些功能免费吗?怎么使用方法详细教程指南
AmbientGPT 是什么? AmbientGPT是一个革命性的编程辅助工具,允许开发者在本地运行GPT- 4 和基础模型,同时能够直接推断屏幕上下文,从而无需手动上传上下文信息,大大提高了代码编写和问题解决的效率。 AmbientGPT 有哪些功...
-
AI让网友“吃石头”闹得沸沸扬扬,谷歌副总裁发博回应:不是幻觉
最近一周,网上关于谷歌AI overview(AI概览)的讨论沸沸扬扬,简直快要扛起X平台科技区的流量大旗。 这款在2023年5月就推出测试版的AI搜索,在正式上线前已处理了超十亿次查询,却依旧没能逃过翻车的命运,原因是它仍无法判断“人能不能吃石头、喝胶水...
-
[AIGC] redis 持久化相关的几道面试题
文章目录 1. 什么是Redis持久化? 2. Redis 的持久化机制是什么?各自的优缺点? 2.1 RDB(Redis DataBase),快照 2.2 AOF(Append Only File),日志 3. 优缺点是什么? 4. 如何...
-
大语言模型原理与工程实践:LLaMA 系列
1. 背景介绍 1.1 大型语言模型的兴起 近年来,随着深度学习技术的飞速发展,大型语言模型(LLM)逐渐成为人工智能领域的研究热点。LLM 是一种基于深度学习的自然语言处理模型,能够学习大量的文本数据,并根据这些数据生成自然流畅的文本、回答问题、进行...
-
2024最新GPT4.0使用教程,AI绘画,一站式解决
一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结+DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以...
-
实战经验分享之移动云快速部署Stable Diffusion SDXL 1.0
本文目录 前言 产品优势 部署环境准备 模型安装 测试运行 前言 移动云是中国移动面向政府、企业和公众的新型资源服务。 客户以购买服务的方式,通过网络快速获取虚 拟计算机、存储、网络等基础设施服务;软件开发工具、运行环境、数据库等...
-
Stable Diffusion高级教程 - 图生图(img2img)模式
前言 现在终于可以介绍 Stable Diffusion 除了文生图 (txt2img 之外最重要的功能:图生图 (img2img 。顾名思义,除了根据正向和反向提示词之外,还需要基于一张图片生成图。这个模式下功能很多我们挨个说 img2img 图...
-
工业知识图谱进阶实战
一、背景简介 首先来介绍一下云问科技的发展历程。 云问科技公司由 Chatbot 起家,在 2013 年到 2019 年间一直投身于 Chatbot 领域,主要关注人机对话方向,推出了很多客服类产品。后转型去做知识相关领域的原因是,在 Bert 发布之...
-
Lobe UI - 基于 AntDesign 开发的 AIGC Web 应用的开源 UI 组件库
今天推荐一个可以快速开发 ChatGPT UI 界面的组件库,质量很高,拿来就能用。 Lobe UI 是由 lobehub 团队开发的一套 web UI 组件库,和我之前推荐的很多通用型的 UI 组件库不同,Lobe UI 是专门为目前火热的 AIGC...
-
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mix...
-
LMDeploy高效部署Llama-3-8B,1.8倍vLLM推理效率
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,LMDeploy 对 Llama 3 部署进行了光速支持,同时对 LMDeploy 推理 Llama 3 进行了测试,在公平比较的条件下推理效率是 vLLM 的 1.8 倍。 书生...
-
Midjourney新功能:角色参照指南
基本概念 角色参照(Character Reference):这个功能允许用户在不同的图像生成中保持给定参照角色的一致性。 适用模型:适用于Midjourney V6和Niji6型号。 功能亮点 跨风格一致性:可以在不同风格(如动漫风、写实...
-
Llama-Factory 简介 二, 脚本详解 LLaMA-Factory/src/train_bash.py LLaMA-Factory/src/llmtuner/train/pt/workfl
examples/ ├── lora_single_gpu/ │ ├── pretrain.sh: 基于 LoRA 进行增量预训练 │ ├── sft.sh: 基于 LoRA 进行指令监督微调 │ ├── reward.sh: 基于 LoRA...
-
Stable Diffusion 绘画入门教程(webui)-ControlNet(姿态预处理器openpose)
本片文章接着上篇文章ControlNet介绍他的控制类型,本篇介绍的预处理器为openpose 预处理器:openpose 模型:control_v11p_sd15_openpose 没下载模型的看上篇文章去下载一下哦,不然用不了...
-
开发arXiv论文引擎机器人程序:基于RAG+LangChain+Chainlit+ChromaDB
译者 | 朱先忠 审校 | 重楼 简介 在本文中,我将演示如何使用检索增强生成(RAG 技术构建语义研究论文引擎。具体地说,我将使用LangChain(https://www.langchain.com/ 作为构建语义引擎的主要框架,以及OpenAI公...
-
Stable Diffusion【进阶篇】:模特换装之图生图实现
文章使用的AI绘画SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。 真人换装是图生图的一个典型应用。在图生图中可以通过局部重绘和涂鸦重绘两种方式实现,2种实现方式都差不多,不同的在于涂鸦重绘...
-
腾讯元宝全面测评!国产AI“看剧”时代开启!读懂《庆余年》范闲,揭秘奥特曼宫斗!打通腾讯生态“全村的希望”!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 腾讯在大模型上的动作姗姗来迟。 对于“后发”的抉择,腾讯想得很清楚。 在“腾讯元宝”上线的发布会上,腾讯云副总裁、腾讯混元大模型负责人刘煜宏说,“虽然行业内看起来火热,但是中国移动...
-
【AIGC】本地部署 ollama(gguf) 与项目整合
首先,先跟各位小伙伴说一句 Sorry 。上一篇文章《【AIGC】本地部署通义千问 1.5 (PyTorch 》并没有考虑企业成本问题,虽然代码可以跑通,但是中小型企业想通过该代码实现项目落地还是比较困难的。为此,本文将采用 GGUF 预量化大模型结合 O...
-
利用人工智能和机器人推动科学发展
人类研究人员将永远在科学中发挥作用,但人类在探索科学方面有许多局限,我们需要吃饭和睡觉,我们的情绪会影响行为,我们的身体很容易受到不可挽回的伤害——所有这些都可能阻碍科学成就。美国阿贡国家实验室最近的发展表明,应该让机器人做一些工作,研究人员称之为“自主...
-
沙特阿美投资中国AI初创企业智谱AI 估值达30亿美元
据国外媒体报道,沙特阿拉伯国有石油集团沙特阿美的风险投资部门Prosperity7近日参与了中国生成式人工智能初创企业智谱AI的新一轮融资,投资金额约为4亿美元,使得智谱AI的估值达到了约30亿美元。 图源备注:图片由AI生成,图片授权服务商Midjou...