-
2024过半,AI卷到哪儿了?
AI创业者陈冉,发现行业里有一些“怪现象”。 很多客户向他反馈,自己很困惑。一方面,大模型更新速度太快,搞不清楚到底哪个好用;同时,自己也不知道大模型怎么跟业务结合;另外,自己的数据集究竟能不能精调出一个好用的大模型,心里也没谱。 最后的结果就是,愿意投入...
-
纯干货篇!用Stable diffusion制作广告的保姆级教程
今天就想给大家演示一般如何使用Stable diffusion为你的产品添加场景,秒变广告大片。掌握这个技能,你可以随意将产品添加不同的场景,节约复杂的拍摄布景和拍摄成本。文末附资料噢。 话不多说,接下来是详细讲解演示流程 首先选出一张你的产品图,如果...
-
OpenAI声称挫败了俄罗斯、以色列等国的“舆论黑客”
近日,因安全团队核心人员离职而深陷信任危机的OpenAI发布了最新的安全报告,宣称在过去三个月中挫败了五个利用ChatGPT操控舆论的黑客组织APT行动(舆论黑客)。 OpenAI将操控舆论的影响力活动(IO)定义为“试图以欺骗的方式操纵舆论或影响政治...
-
ElevenLabs推出创新AI音频模型 可生成各种音效
ElevenLabs最近推出了一款创新的AI音频模型,这一技术允许用户仅通过文本提示就能生成各种音效、短乐器曲目、音景和各种角色声音。这项技术的应用范围非常广泛,尤其对以下领域的专业人士来说是一个巨大的福音: 内容创作者:无论是制作YouTube视频、播客...
-
[AIGC] 深入理解 Java 的 JSON 序列化和反序列化
在现代软件开发中,JSON(JavaScript Object Notation)已经成为一种非常流行的数据交换格式。它以简洁、易读和易解析的文本形式表示结构化数据。在 Java 中,我们可以使用org.json包来进行 JSON 的序列化和反序列化操作。...
-
生成式人工智能在企业中的十大用例
在动态的人工智能世界中,生成式人工智能作为一种变革性约束而发展,重塑了企业,并重新分类了发展的可能性。其核心是,生成式人工智能解决了机器学习算法的能力,以生成反映现实世界案例的现代合成信息。生成式人工智能,也被称为GenAI,暗指人工智能更广泛领域内的一...
-
抖音:将打击使用AI技术P图侮辱他人等行为
抖音发布《重点打击泄露隐私、P图公开辱骂等网络暴力言论的公告》称,2024年至今,抖音共发现并处置网暴舆情162件拦截超过5000万条评论信息,发文警示、教育施暴者近70万个。 抖音表示,抖音一直致力于打造健康向上、风清气正的社区氛围,严厉打击实施或教唆、...
-
AIGC | AI提示词构建
文章目录 ?BARD提示词构建法 ?前言 ?第一步:阐述背景Background ?第二步:定义目标Aim ?第三步:设定角色Role ?第四步:设置要求Demand ?测试与迭代思路 本文提到的BARD方法来自艾文公开...
-
斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
在 GPT-4o 出世后,Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越的性能展现了它强大多模态能力。开源领域的领头羊 Llama3 曾在几乎所有基准测试中都超越了 GPT-3.5,甚至在某些方面超越了 GPT-4。这次就要闷声...
-
下代GPU会非常难买!黄仁勋敦促企业快买AI芯片 买越多越省钱
快科技6月3日消息,近日,黄仁勋公开表示称,下代GPU会非常难买,并希望企业买多一些自家的AI芯片。 黄仁勋预警,下一代GPU会非常难买。同时他还敦促企业采购更多AI芯片。 你买的越多,省的就越多。这就是所谓的CEO数学。虽然不准确,但却是正确的。”黄仁勋...
-
大模型微调之 使用 LLaMA-Factory 微调 Llama3
大模型微调之 使用 LLaMA-Factory 微调 Llama3 使用 LLaMA Factory 微调 Llama-3 中文对话模型 安装 LLaMA Factory 依赖 %cd /content/ %rm -rf LLaMA-Factory...
-
OpenAI把GPT-4原始版给了他们:研究不微调只靠提示词能走多远
除了OpenAI自己,居然还有别人能用上GPT-4-Base版?? 也就是未经微调的预训练版,还不会对话聊天,只会补全句子的模型。 EPFL(瑞士洛桑联邦理工)团队申请到了访问权限,用于研究“上下文学习足以让大模型跟随指令吗?”。 也就是不用监督微调、...
-
麦肯锡调查显示:生成式AI应用大中华区增长最快
据全球顶级咨询公司麦肯锡(McKinsey & Company)发布的最新调查报告《he state of AI in early2024:Gen AI adoption spikes and starts to generate value》,显...
-
老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题
想了解更多AIGC的内容, 请访问:51CTO AI.x社区 https://www.51cto.com/aigc/ 就在刚刚,老黄手持Blackwell向全世界展示的那一刻,全场的观众沸腾了。 它,是迄今为止世界最大的芯片! 眼前的这块产品,凝聚着数...
-
超越Devin!姚班带队,他们创大模型编程新世界纪录
超越Devin!SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。 同时创造了非GPT-4o基模的最高纪录(SOTA)。 我们都知道,SW...
-
生成式人工智能(AIGC),到底对企业、对商业有何影响,我们个体未来如何把握发展机会?
一、中国生成式人工智能行业整体发展现状 中国生成式人工智能行业进入爆发式增长阶段,2023年以来各类入局企业近500家,整体产业热度上呈现出“应用层 > 模型层 > 数据层 > 算力层”的发展轨迹。其中,应用层直面下游用户,有望...
-
英伟达新研究:上下文长度虚标严重,32K性能合格的都不多
无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长度的都有。 但一番考验下来,在新指标“有效上下文”上缩水严重,能达到32K的都不多。 新基准名为RULER,包含检索、多跳追踪、...
-
一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线
还记得之前给大家推荐的中文语音AI天花板ChatTTS吗?这个可平替 GPT-4o的文本转语音项目一上线就爆火出圈,短短几天就在GitHub上斩获了16.9K的Star 量。 而现在,ChatTTS正式上线了官网,所有用户都可以直接在线体验了。 主要功能...
-
Stable Diffusion扩散模型【详解】小白也能看懂!!
文章目录 1、Diffusion的整体过程 2、加噪过程 2.1 加噪的具体细节 2.2 加噪过程的公式推导 3、去噪过程 3.1 图像概率分布 4、损失函数 5、 伪代码过程 此文涉及公式推导,需要参考这篇文章: Stable...
-
ICML2024高分!魔改注意力,让小模型能打两倍大的模型
改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。 DCMHA解除...
-
Stability AI开源SD 3:6月12日可下载 不可商用
Stability AI 的联合首席执行官正式宣布了 Stable Diffusion 3 Medium 的开放发布日期为6月12日。这一消息让许多期待使用这一模型的人欣喜不已。 Stable Diffusion3Medium 是Stability AI...
-
我的stable-diffusion入门
开头 翻到一个感兴趣的帖子,然后开始了这段折腾 载下来用了,发现用的是cpu出图,慢的很,还是需要stable diffusion webui来做,所以就开始找资料 参考链接 找模型:https://civitai.com/https://hug...
-
时间序列分析的表示学习时代来了?
表示学习作为深度学习中的核心,近期越来越多的被应用到了时间序列领域中,时间序列分析的表示学习时代已经来了。本文为大家带来了2020年以来顶会的5篇时间序列表示学习相关的核心工作梳理。 1.Unsupervised Scalable Representa...
-
英伟达发布数字人AI技术NVIDIA ACE 提升角色互动体验
NVIDIA最近推出了一种名为Avatar Cloud Engine (ACE)的先进数字人AI技术,旨在提升游戏和虚拟世界中角色的互动体验。 以下是NVIDIA ACE技术的关键特点: 智能对话能力:ACE技术能够让游戏中的NPC拥有真实的对话能力,...
-
维普重复率在哪看 ai写作
大家好,今天来聊聊维普重复率在哪看 ai写作,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 如何查看维普重复率?7步指南助你一臂之力!在学术研究和论文撰写中,查重是确保学术诚信和原创性的重要环...
-
知识图谱检索增强的GraphRAG(基于Neo4j代码实现)
图检索增强生成(Graph RAG)正逐渐流行起来,成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性,将数据以节点和关系的形式组织起来,从而增强检索信息的深度和上下文关联性。图在表示和存储多样化且相互关联的信息方面具有天然优势,能够轻松捕...
-
中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等
全国网络安全标准化技术委员会在官网发布了,国家标准《网络安全技术 生成式人工智能服务安全基本要求》征求意见稿。 该意见稿一共分为《网络安全技术 生成式人工智能服务安全基本要求-标准文本》、意见汇总处理表和编制说明三大块。 其中,标准文本涵盖训练数据安全要求...
-
AI摄影 | Stable Diffusion 真人照片转动漫
大家好,我是程序员晓晓 “ 相信我们很多人在看过动漫/动画后,都想看一看二次元世界中的自己长什么样子,那今天就以客户照片为例,说说我们如何用 Stable Diffusion,让 AI 帮我们将真实照片转成一个绝美二次元美男子……” 客户原图是这样的,...
-
欧盟委员会成立人工智能办公室
欧盟委员会发布在委员会内设立了的人工智能办公室。人工智能办公室将领导欧盟在人工智能研究和政策方面的工作,包括促进人工智能的未来发展、部署和使用,促进社会和经济效益以及创新,同时降低风险。 人工智能办公室将在《人工智能法案》(AI Act)的实施中发挥关...
-
Nvidia发布GeForce RTX增强版,为AI PC数字助手提供支持
Nvidia 在Computex 展会上推出了新的 RTX 技术,为新的 GeForce RTX AI 笔记本电脑提供动力。其中,Project G-Assist 技术演示为 PC 游戏和应用提供上下文感知的帮助。这项技术首次在 Studio Wildca...
-
AI绘画 究竟在哪些方面降低了门槛
AI绘画的产物是图像。图像对人类的认知、情感和文化发展起着重要的作用,包括信息传递、创造性表达、历史记录、审美享受和交流。 从原来的纸笔调色板到数字时代的数字板、绘图软件,再到AI绘画时代,任何人都可以用几行简单的文字创作出高质量的艺术作品。人类创作的门...
-
大模型“分区”部署在云和边缘更合适?
作者 | David Linthicum 出品 | 51CTO技术栈(微信号:blog51cto) 众所周知,大型语言模型(LLMs)需要大量的计算资源。这意味着开发和部署主要集中在强大的集中式系统上,如公共云提供商。然而,尽管许多人认为我们需要大量的...
-
英伟达推AI游戏助手G-Assist:可指导玩家玩游戏并优化设置
Nvidia 的 G-Assist 是一款旨在辅助玩家完成游戏并优化 PC 设置的 AI 助手。在技术演示中,G-Assist 展示了它如何通过语音查询回答游戏中的问题,比如 “下一个早期游戏武器是什么,我在哪里可以找到它的制作材料?” 这样的问题。 更...
-
whisper-v3模型部署环境执行
1. 安装whisperV3 github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-ru...
-
大型科技公司拥才有承担 AI 训练数据成本的能力
AI 的发展离不开数据,而这种数据的成本越来越高,这使得除了最富有的科技公司外,其他公司难以承担这一成本。根据去年 OpenAI 的研究人员 James Betker 的文章,AI 模型的训练数据是决定模型能力的关键因素。传统的 AI 系统主要是基于统计机...
-
AIGC-音频生产十大主流模型技术原理及优缺点
音频生成(Audio Generation 指的是利用机器学习和人工智能技术,从文本、语音或其他源自动生成音频的过程。 音频生成行业是AIGC技术主要渗透的领域之一。AI音频生成行业是指利用人工智能技术和算法来生成音频内容的领域。按照输入...
-
使用 Springboot3.x 实现考试系统中接打电话的识别与处理
本专题将深入探讨考试系统中常见的复杂技术问题,并提供基于Spring Boot 3.x的解决方案。涵盖屏幕切换检测与防护、接打电话识别处理、行为监控摄像头使用、网络不稳定应对等,每篇文章详细剖析问题并提供实际案例与代码示例,帮助开发者应对挑战,提升考试系...
-
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。 能够同时生成多种模态输出的多模态模型一般是通过某...
-
2024年最新AI绘画普及课【二】文生图入门_平铺 分块 (tiling)
正面提示词: (1girl:2.0 , solo, nilou \(genshin impact\ , solo, long hair, jewelry, blue gemstone, earrings, horns, crown, cyan satin...
-
基于llama.cpp的GGUF量化与基于llama-cpp-python的部署
前言:笔者在做GGUF量化和后续部署的过程中踩到了一些坑,这里记录一下。 1.量化 项目地址:llama.cpp 1.1 环境搭建 笔者之前构建了一个用于实施大模型相关任务的docker镜像,这次依然是在这个镜像的基础上完成的,这里给出Dock...
-
LLM的「母语」是什么?
大语言模型的「母语」是什么? 我们的第一反应很可能是:英语。 但事实果真如此吗?尤其是对于能够听说读写多种语言的LLM来说。 对此,来自EPFL(洛桑联邦理工学院)的研究人员发表了下面这篇工作来一探究竟: 图片 论文地址:https://arxiv.or...
-
AIGC降重最简单处理【收藏】
AIGC降重:简单有效的处理策略 随着人工智能技术的飞速发展,AIGC(人工智能生成内容)已经渗透到了我们生活的方方面面,从新闻报道、广告创意到小说写作,其身影随处可见。然而,随之而来的一个问题是内容的重复性和原创性。为了确保AIGC内容的质量和价值...
-
【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么
LLaVA++能够为Phi-3和Llama-3带来的主要好处包括: 视觉处理能力的增强:通过整合Phi-3和Llama-3模型,创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本,这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...
-
【Stable Diffusion】ModuleNotFoundError: No module named ‘ifnude‘ and roop v0.0.2
提示:ModuleNotFoundError: No module named ‘ifnude’ 一、issues/299:ModuleNotFoundError: No module named ‘ifnude’ 路径 cmd 中也可以看到,...
-
Midjourney 换脸大法:保姆级教学
元宇宙和人工智能的不断发展使得真实世界和虚拟世界的边界越来越模糊。本文将介绍如何借助 Midjourney 和另一个第三方插件 InsightFace,来实现令人惊叹的换脸效果。 InsightFace 简介 InsightFace 是由中科院研...
-
【AIGC调研系列】XTuner、Unsloth方案对比
XTuner和Unsloth都是用于大型语言模型(LLM)训练和微调的工具,但它们在设计理念、技术实现和性能表现上存在一些差异。 技术架构与支持的模型规模: XTuner支持千亿级参数的模型,并能够处理超过百万个tokens的序列。它通过序列...
-
llama_factory微调QWen1.5
GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMsUnify Efficient Fine-Tuning of 100+ LLMs. Contribute to...
-
灵活运用Stable Diffusion放大你的图像
文章使用的AI绘画SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。 众所周知,Stable Diffusion对电脑硬件的要求比较高,为了在图像质量和生成速度之间找到平稳点,我们通常采用的方...
-
探索文心一言指令:AI与自然语言处理的新篇章
引言:自然语言处理与文心一言指令的探索 (1)自然语言处理的发展及其重要性 自然语言处理(NLP)是人工智能(AI)的一个关键领域,致力于使机器能够理解、解释和响应人类语言的方式。自从20世纪50年代计算机科学诞生以来,NLP已经从简单的模式识...
-
使用LLaMA Factory来训练智谱ChatGLM3-6B模型
使用LLaMA Factory来训练智谱ChatGLM3-6B模型时,以下是一个训练过程: 1. 环境搭建 a. 安装Python和Anaconda 下载并安装适合你操作系统的Python版本(推荐Python 3.10或更高版本)。 安装Anac...