-
降AIGC痕迹:AI工具在学术写作中的创新应用
论文查重和降重是确保学术成果原创性及学术诚信的关键步骤,直接影响我们的学业成果和毕业资格。传统的论文查重方法主要包括使用查重软件和个人自查,而论文降重通常涉及改写、使用同义词替换、内容的扩展和深化,以及正确的引用和注释等方式来增强原创性。 然而,这些传统...
-
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序 在人工智能领域中,语音识别技术日益成为核心组成部分,尤其是在实时翻译、字幕制作和无障碍沟通等方面。OpenAI 的 Whisper 模型以及其优化版本 Faster-...
-
爆“卷”的AI视频,大厂向左,创企向右
“生成的人物一转身就变成老外,怎么解决呢?” “没有办法,10s中动作大的,人物一致性有问题,只能抽卡,多刷几个,选择一个变化不大的。” 在一个以Ruanway学院为主题的群中,不断有各种针对AI视频生成的问题产生,而群内有AI视频生成使用经验的,则也在积...
-
PHP性能探讨 ai写作
PHP性能探讨 一、引言:PHP性能的现状 PHP,作为一种广泛应用于Web开发的脚本语言,已经走过了数十年的历程。在这个过程中,PHP的性能一直是人们关注的焦点。那么问题就是,关于PHP性能的评价却众说纷纭,既有赞誉之声,也不乏批评之语。本文旨在...
-
如何有效地使用Code Llama:AI编程助手的实用指南
在当今快速发展的人工智能时代,编程领域也迎来了革命性的变革。Meta公司最近发布的Code Llama模型就是这一趋势的代表作。本文将深入探讨如何充分利用Code Llama的各种功能,为开发者提供一个全面的指南,帮助您更好地理解和应用这一强大的AI编程工...
-
stable diffusion最全插件大全,新手必备指南
Stable diffusion30个必备插件推荐,给我点个赞吧,兄弟们 1,ComfyUI,SD扩展里面直接搜索就行, ComfyUI 是一个基于节点操作的UI界面,玩过建模的更容易学 安装后大概是这样的 评价:comfyui,...
-
使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调
文章目录 模型及数据: 模型下载 数据 LLaMA-Factory启动 拉取代码 启动webui 模型训练 数据导入 数据预览 设置模型路径 配置参数及参数的保存 开始训练 过程观察 加载模型、对话 模型导出、再次加载...
-
政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署ComfyUI:功能最强大、模块化程度最高的Stable Diffusion图形用户界面和后台
目录 ComfyUI的特性介绍 开始安装 做点准备工作 在Conda虚拟环境中进行 依赖项的安装 运行 政安晨的个人主页:政安晨 欢迎 ?点赞✍评论⭐收藏 收录专栏: 零基础玩转各类开源AI项目 希望政安晨的博客能够对...
-
超详细高质量图解 Stable Diffusion
最近有一篇国外博主分享的 图解Stable Diffusion 博客 写的非常的好,让你从零开始彻底搞懂图像生成模型的原理,我在这里给大家专业翻译整理一下。 正文开始 人工智能图像生成是最新的人工智能功能,令人惊叹不已(包括我的)。从文本描述中创造出...
-
Stable Diffusion【真人模型】:SD1.5人像模型新高度,超级逼真的AI真人模型:AWPortaint
今天和大家分享一个基于SD1.5基础模型训练的人像大模型AWPortrait。该模型在真人写实摄影方面效果超级逼真,能够模拟在真实摄影中的光影效果、皮肤纹理质感、甚至是人物的表情和妆容。 目前最新的版本是V1.4,在V1.3版本的基础上升级而来,对大模型...
-
AIGC实战:LLaMA2打造中文写作利器——数据准备与模型训练全攻略
目录 一、下载并加载中文数据集 二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1)先将一篇篇文本拼凑到一起(只是简单的拼凑一起,用于训练tokenizer) 2...
-
AIGC提示词---如何写提示词?
你真的了解你的AI助手吗? 想象一下,你和别人使用相同的AI工具,但为何他的工作效率总是高出一截?秘诀可能就藏在那些看似简单的提示词里。精准的提示词是解锁AI潜能的关键,它们能让AI更好地理解你的需求,从而提供更准确、更高效的回答。 编写提示词,好比电...
-
AI绘画教程:Stable Diffusion中如何控制人像的姿势?
在AI绘画中,有时候我们需要主角(人物或动物)摆出特定的姿势,该怎么做呢? 第一种方法:以图生图 打开Stable Diffusion界面,点击imag2img 下面出现一个”drop image here or click to upload”...
-
腾讯推出新自研AI引擎:游戏研发效率提升超40倍
快科技7月30日消息,日前在ChinaJoy高峰论坛上,腾讯公司副总裁张巍表示,AI在游戏领域已经成为研发标配”。 腾讯于今年推出了新的自研AI引擎,能够让游戏场景制作、内容生成等领域的部分工作效率提升40倍以上。 据了解,腾讯是较早系统化布局AI研发的企...
-
AI绘图赚钱,普通人用Stable diffusion 还是Midjourney,他们有什么区别?
给大家用2000字说一下Stable Diffusion 和Midjourney 从前期部署→到操作生成→再到效果及应用,为你分析两者之间的区别。 SD控制性极强,可高度自定义,难度大,完全免费。 MJ对小白非常友好,图片质量高,模型有限,插件少,控制...
-
深度解读AIGC技术背后的算法原理
深度解读AIGC技术背后的算法原理 欢迎光临未来的文字工厂:AIGC的奇妙世界 想象力的火花:AIGC技术如何让创作焕发新生 从零到英雄:AIGC背后的核心算法简史 拨开云雾见青天:解密AIGC的算法基础 语言模型:词与句的舞蹈编排师 深...
-
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
【新智元导读】今早,所有开发者们被突如其来iOS18.1测试版砸晕了!没想到,苹果AI这就可以上手尝鲜了,一大波测评刷屏全网。更惊喜的是,苹果AI背后的基础模型47页技术报告,也一并上线了。 一大早,人们期待已久的「苹果AI」首个预览版,正式向开发者们推送...
-
当AI绘画 开始抢动漫人饭碗
每一次生产力的变革,在带来技术进步与更高效率的同时,也都无可避免地带来一次人才的更迭。在过去的几年里,人工智能取得了极快的发展,其中包括基于机器学习和深度学习的“图像生成技术”。ChatGPT4的出现,更是将AI 绘图降低到几乎零门槛,普通用户只需输入文本...
-
Stable Diffusion【应用篇】【手部修复】:SD手部问题修复大揭秘
在AI绘画中,手部问题一直是一个麻烦的问题。双手变形、手指缺失、手指多余这些问题常常困惑着我们。本文主要讨论一下关于Stable Diffusion中有哪些方法可以用于修复手部问题。 一. 素材准备 在文生图的功能界面生成一张有手部问题的图片。...
-
不是NVIDIA!苹果官宣AI模型训练用的谷歌芯片
快科技7月30日消息,苹果公司在其技术论文中透露,其人工智能系统Apple Intelligence所依赖的模型并非基于NVIDIA芯片,而是在谷歌设计的云端芯片上进行预训练的。 NVIDIA的GPU一直以高价位和高需求著称,是许多大型科技公司AI训练的首...
-
文生视频大模型,短视频的过弯点?
随着今年初Sora的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。 6月初,快手自研的视频生成大模型“可灵”正式上线。可灵AI采用了与Sora相似的技术路线,能够生成具有合理运动和模拟物理世界特性的视频。 截至目前,已有超百...
-
LLaMA-MoE:基于参数复用的混合专家模型构建方法探索
自Mixtral以来,大家对混合专家模型(Mixture-of-Experts,MoE)的关注越来越高。然而从零训练MoE模型的成本极大,需要耗费海量的计算资源。为此,我们探索了一种基于参数复用的MoE快速构建方法。 该方法首先将LLaMA...
-
llama 2 改进之 RMSNorm
RMSNorm 论文:https://openreview.net/pdf?id=SygkZ3MTJE Github:https://github.com/bzhangGo/rmsnorm?tab=readme-ov-file 论文假设LayerNorm...
-
一文速览Llama 3.1——对其92页paper的全面细致解读:涵盖语言、视觉、语音的架构、原理
前言 按我原本的计划,我是依次写这些文章:解读mamba2、解读open-television、我司7方面review微调gemma2,再接下来是TTT、nature审稿微调、序列并行、Flash Attention3.. 然TTT还没写完,7.23日...
-
AIGC生成式人工智能
AIGC生成式人工智能 什么是生成式AI,什么是AIGC?今天我们来详细的认识一下: 生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。...
-
手把手教你用聆思CSK6大模型开发板接入文心一言/千帆大模型
前言 多模态交互离不开硬件载体,近期有不少开发者在研究大模型开发板除了使用出厂示例自带的星火大模型,能不能接入文心一言、通义千问、豆包、智谱glm、kimi等国内的大模型,这个是必须支持的。但由于各家接口和数据格式不一样,有些朋友直接参考...
-
秘密打造「AI陶哲轩」 震惊数学圈!谷歌IMO梦之队首曝光,菲尔兹奖得主深度点评
【新智元导读】19秒破解几何难题,谷歌AI夺得IMO银牌在业界掀起了巨震。就连菲尔兹奖得主陶哲轩,前IMO美国队负责人罗博深都对此大加赞赏。更有AI大佬高调预测,若谷歌继续加码研究,应该可以造出一个「AI陶哲轩」。 谷歌DeepMind正在做的,是要打造出...
-
日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?
2024年的 AI 图像生成技术,又提升到了一个新高度。 技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6史诗级更新,后有开源巨头 Stable Diffusion3独领风骚,而 DALL・E3背靠 ChatGPT 这棵...
-
AI涌入巴黎奥运,颠覆观赛的黑科技大起底
巴黎人上一次在家门口看奥运,正好是100年前的事。 两届奥运会,世事大变迁,但「技术」始终是主角——1924年,巴黎举办第八届夏季奥运会。这届奥运会首次应用广播直播,极大扩大了赛事的观众范围。2024年,收音机已是“时代的眼泪”,但我们又在见证:技术变革如...
-
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。 杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016年加入阿里巴巴,就职于达摩院智能计算实验室;2023年3月入职字节跳动。 她在...
-
音频转文字哪家强?faster-whisper还是paddlespeech,我的折腾吐槽记录
前言 作为一个魔武双修的python程序员,面对产品小姐姐提出的需求。我只能迎难而上。 目前开源的音频转文字都有哪些?效果如何?速度怎么样?带着这一连串的问题,我在github的海洋里畅游良久。接下来我把我的发现都记录如下。 1. paddles...
-
AI大模型原理(通俗易懂版)——AIGC
传送门:AI大模型原理(通俗易懂版)-CSDN博客 AIGC 说起近期的热门科技词汇,AIGC当之无愧位列其中。从某一天开始,我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。 这些AI生...
-
阿里云OS Copilot:解锁操作系统运维与编程的智能助手
目录 引言 OS Copilot简介 OS Copilot的环境准备 创建实验资源 安全设置 设置安全组端口 创建阿里云AccessKey 准备系统环境 OS Copilot的实操 场景一、用OS Copilot写脚本和注释代码 ...
-
使用llama.cpp启动GPU模型计算
查询GPU使用状态: watch -n 0.5 nvidia-smi 使用GPU编译llama.cpp: make LLAMA_CUBLAS=1 用过make的记得删除项目,重新再以上执行命令,要不还...
-
这5款宝藏国产AI绘画工具,不允许有人还不知道!(建议收藏)
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~ 记得去年一位网友和我聊天的时候说到,“如果能用 AI 出一张图,我就心满意足了”。 这个...
-
Copilot有哪些功能?
微软的Copilot具备多种功能,旨在通过人工智能技术辅助用户更高效地完成工作。以下是Copilot的一些主要功能: 内容生成与编辑:Copilot能够生成文档摘要,重写内容,并修改现有的Word文档内容。 图片优化:它还能寻找适合文档的配图,并进...
-
OpenAI要再次带国内大模型玩家飞?
被传了几个月,OpenAI终于官宣入局AI搜索。 北京时间7月26日,OpenAI在官网发布消息,宣布推出AI搜索产品SearchGPT。 OpenAI CEO山姆·奥特曼在X(前推特)公布喜讯,比起夸自己,更像是diss前人:“我们认为如今的搜索还有改...
-
【奶奶看了都会了】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程
1.作品图 2.准备工作 目前网上能搜到的stable-diffusion-webui的安装教程都是Window和Mac M1芯片的,而对于因特尔芯片的文章少之又少,这就导致我们还在用老Intel 芯片的Mac本,看着别人生成美女图片只能眼...
-
华为Pura 70 Pro发布鸿蒙OS 4.2 172版更新:支持AI扩图 一键拯救废片!
快科技7月28日消息,日前,华为Pura 70 Pro推送鸿蒙OS 4.2.0.172(SP2C00E170R4P7)版本更新,新增AI扩图功能。 更新后,图库的AI修图新增AI扩图功能,可基于AI构图算法与图像生成式技术,理解图片内容的细节和结构,分析推...
-
Stable Diffusion工具:ComfyUI VS WebUI
前言: 在当今快速发展的社会,掌握一项实用的技能对于安身立足至关重要。很多人推荐学习编程、数据分析等技术,但其中最引人瞩目的当属人工智能(AI)。特别是AI绘画,融合了艺术与科技,成为了当今最具潜力的领域之一。通过学习AI绘画,你不仅可以探索创意的无限可...
-
3 种华丽的Midjourney 风格参考
1. 参考风格: 70s – 70 年代 (灰色和青色 下面的图片可以作为你的 Midjourney 70s 风格参考图。 用法: --serf urlA urlB urlC 案例1: 70 年代产品的编辑摄影 + 复古美学...
-
AI绘画Stable Diffusion - 功能性LoRA推荐!年龄调整、衣服增减、人物距离调整一键搞定!
大家好,我是画画的小强 AI绘画工具 **Stable Diffusion(SD)**以其强大的图片生成能力被越来越多的爱好者使用,而LoRA技术,作为SD中的一个关键组件,为创作者提供了更多的灵活性和控制力。今天,我们将推荐几种功能性LoRA,看它们如...
-
在modelscope(魔塔)部署自己的Stable-Diffusion-WebUI并实现网络穿透,可外部调用
一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍,大家可以自行搜索完成账号注册及实名认证,领取免费GPU算力; 登陆后按下图指示依次点击选择对应配置,最后点击‘启动’开启并进入服务器...
-
代码规范 | 前端代码review参考案例生成AI助手【提示词工程赋能、AIGC】
前言 最近团队在重构项目,用公司新的组件库来替换掉原来项目的UI,业务、代码和UI都得进行调整,工程量大,由于不同开发者的编码习惯和风格不同,为了规范代码整体的风格和规范,我提出可以写一个前端代码review参考案例文档,用做团队编码的规范,同时也给研发...
-
第43篇:实现企业级大型AIGC项目:模型并行与分布式训练
在构建企业级大型AIGC(人工智能生成内容)项目时,模型并行与分布式训练是提升计算效率和处理能力的关键技术。随着模型规模和数据量的不断增长,单台设备的计算能力往往无法满足需求。因此,利用多台设备进行并行计算和分布式训练成为了必然选择。本文将深入讲解模型并行...
-
开源语音转文本 Speech-to-Text 大模型实战之Whisper篇
前言 随着深度学习技术的不断发展,语音转文本(Speech-to-Text,STT)技术取得了显著的进步。开源社区涌现了许多高效的STT大模型,为开发者提供了强大的工具。本文将以OpenAI推出的Whisper模型为例,详细介绍如何使用该模型进行语音转文...
-
【AI大模型】程序员AI的未来——Copilot还是Claude3.5 Sonnet?
近期,Anthropic发布了Claude 3.5 的“大杯”模型 —— Claude 3.5 Sonnet! 这次发布的 Sonnet 代表意大利的“十四行诗”,结构复杂,在智能水平、功能多样性和处理能力上都有所提升,能够应对更复杂的认知任务,提供更高...
-
自回归模型胜过扩散模型:用于可扩展图像生成的 Llama
? 文献卡 Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation 作者: Peize Sun; Yi Jiang; Shoufa Chen; Shil...
-
Stable Diffusion【真人模型】:人脸特美的人像摄影大模型wuhaXL_realisticMixV3.0
今天和大家分享一个基于SDXL的真人大模型:wuhaXL_realisticMix。该模型无需使用LORA**就能生成的特别漂亮的人脸,虽然有时候人脸有些假,但是生成的人脸确实非常漂亮。 该模型底模融合了WhiteXL_realisticMix,训练素材...
-
stable diffusion 插件篇(1)
前言: 首先要讲解的第一个超强插件是controlnet,跟着一起学习的小伙伴应该知道,如果仅是仅凭文生图或者是图生图的功能,想要生成的图片如自己所愿是比较有困难的,但是在sd里面,插件controlnet是可以做到帮助我们控制生图的,并且掌握contr...