-
大模型行业,根本没有什么“真”开源?
最近一段时间开源大模型市场非常热闹,先是苹果开源了 70 亿参数小模型DCLM,然后是重量级的Meta的Llama 3.1 和Mistral Large2 相继开源,在多项基准测试中Llama 3. 1 超过了闭源SOTA模型。 不过开源派和闭源派之间的争...
-
用Conda配置 Stable Diffusion WebUI 1.9.4
用Conda配置 Stable Diffusion WebUI 1.9.4 本文主要讲解: 如何用Conda搭建Stable Diffusion WebUI 1.9.4环境,用Conda的方式安装,不需要单独去安装Cuda了。 1. 安装minic...
-
LLama-Factory使用教程
本文是github项目llama-factory的使用教程 注意,最新的llama-factory的github中训练模型中,涉及到本文中的操作全部使用了.yaml配置。 新的.yaml的方式很简洁但不太直观,本质上是一样的。新的readme中的.yam...
-
stable diffusion学习指南
参考教程 元素同典:元素同典:确实不完全科学的魔导书 stable diffusion 入门:腾讯文档 文生图界面参数设置 prompt 权重 AI 对于关键词的辨识以从前到后为顺序,以逗号为分割。距离较近的词的确更容易产生关联、进行叠加,而更...
-
LLaMA 3.1:开源大模型的新里程碑
7月23日,Meta公布了它的人工智能模型Llama的最新版本——Llama 3.1。这次更新推出了三种不同的版本,其中包括了Meta迄今为止最高级的人工智能模型。重要的是,Llama 3.1依旧是开源的,这意味着谁都可以免费使用这款模型。这次发布展示了M...
-
Llama 3.1要来啦?!测试性能战胜GPT-4o
哎呀,Meta声称将于今晚发布的Llama 3.1,数小时前就在Hugging Face上泄露出来了?泄露的人很有可能是Meta员工? 还是先来看泄露出来的llama3.1吧。新的Llama 3.1模型包括8B、70B、405B三个版本。 而经...
-
AI多模态实战教程:面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理
一、项目简介 MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型(MLLMs),提供⾼质量的⽂本输出,已发布4个版本。 1.1 主要模型及特性 (1)MiniCPM-Llama3-V 2.5: 参数规模: 8B 性能: 超越...
-
接入百度文心一言API教程
然后,编辑文章。点击AI识别摘要,然后保存即可 COREAIPOWER设置 暂时只支持经典编辑器.古腾堡编辑器等几个版本后支持.在比期间,你可以自己写点摘要 摘要内容 AL识别摘要 清空 若有收获,就点个赞吧 接入文心一言 现...
-
OpenAI的ChatGPT-4和百度文心一言对比
目录 OpenAI的ChatGPT-4和百度文心一言对比 1.引言 2.文心一言概览 3.GPT-4概览 4.技术特点比较 4.1 模态输入 4.2 语言处理 4.3 安全性和准确性 5.应用场景比较 5.1 商业应用 5.2 教育和...
-
LLMs之Llama 3.1:Llama 3.1的简介、安装和使用方法、案例应用之详细攻略
LLMs之Llama 3.1:Llama 3.1的简介、安装和使用方法、案例应用之详细攻略 导读:2024年7月23日,Meta重磅推出Llama 3.1。本篇文章主要提到了Meta推出的Llama 3.1自然语言生成模型。 >>...
-
博主吐槽微博AI小助理乱回网友:不能瞎回啊 跟车企签了保密协议
快科技7月31日消息,汽车博主韩路发文吐槽微博AI小助理。 韩路称,他让网友猜个打码的车,网友猜个车名,AI小助理给人家回复:对!就是它! 韩路很是无语,这个车他跟车企签了保密协议,AI小助理不能瞎回啊。 还有上次他发帖说有人张口跟我要300万,底下网友起...
-
惠普发布AI PC全场景AI解决方案:接入文心一言、新增WPS AI
快科技7月31日消息,日前惠普在AI PC全场景AI生态大会上,推出全新的AI PC全场景AI解决方案和升级版的AI PC产品组合。 惠普AI PC全场景AI解决方案的核心亮点之一是惠小微智能助手4.0的升级,该智能助手新增了四大AI能力。 其中,AI效率...
-
AI日报:GPT-4o灰测高级语音功能,ChatGPT版Her来了;Midjourney V6.1上线;360安全大模型免费开放
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI向ChatGPT...
-
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。 LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段。 后者不仅依赖昂贵的人工标...
-
降AIGC痕迹:AI工具在学术写作中的创新应用
论文查重和降重是确保学术成果原创性及学术诚信的关键步骤,直接影响我们的学业成果和毕业资格。传统的论文查重方法主要包括使用查重软件和个人自查,而论文降重通常涉及改写、使用同义词替换、内容的扩展和深化,以及正确的引用和注释等方式来增强原创性。 然而,这些传统...
-
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序 在人工智能领域中,语音识别技术日益成为核心组成部分,尤其是在实时翻译、字幕制作和无障碍沟通等方面。OpenAI 的 Whisper 模型以及其优化版本 Faster-...
-
爆“卷”的AI视频,大厂向左,创企向右
“生成的人物一转身就变成老外,怎么解决呢?” “没有办法,10s中动作大的,人物一致性有问题,只能抽卡,多刷几个,选择一个变化不大的。” 在一个以Ruanway学院为主题的群中,不断有各种针对AI视频生成的问题产生,而群内有AI视频生成使用经验的,则也在积...
-
PHP性能探讨 ai写作
PHP性能探讨 一、引言:PHP性能的现状 PHP,作为一种广泛应用于Web开发的脚本语言,已经走过了数十年的历程。在这个过程中,PHP的性能一直是人们关注的焦点。那么问题就是,关于PHP性能的评价却众说纷纭,既有赞誉之声,也不乏批评之语。本文旨在...
-
如何有效地使用Code Llama:AI编程助手的实用指南
在当今快速发展的人工智能时代,编程领域也迎来了革命性的变革。Meta公司最近发布的Code Llama模型就是这一趋势的代表作。本文将深入探讨如何充分利用Code Llama的各种功能,为开发者提供一个全面的指南,帮助您更好地理解和应用这一强大的AI编程工...
-
stable diffusion最全插件大全,新手必备指南
Stable diffusion30个必备插件推荐,给我点个赞吧,兄弟们 1,ComfyUI,SD扩展里面直接搜索就行, ComfyUI 是一个基于节点操作的UI界面,玩过建模的更容易学 安装后大概是这样的 评价:comfyui,...
-
使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调
文章目录 模型及数据: 模型下载 数据 LLaMA-Factory启动 拉取代码 启动webui 模型训练 数据导入 数据预览 设置模型路径 配置参数及参数的保存 开始训练 过程观察 加载模型、对话 模型导出、再次加载...
-
政安晨【零基础玩转各类开源AI项目】基于Ubuntu系统部署ComfyUI:功能最强大、模块化程度最高的Stable Diffusion图形用户界面和后台
目录 ComfyUI的特性介绍 开始安装 做点准备工作 在Conda虚拟环境中进行 依赖项的安装 运行 政安晨的个人主页:政安晨 欢迎 ?点赞✍评论⭐收藏 收录专栏: 零基础玩转各类开源AI项目 希望政安晨的博客能够对...
-
超详细高质量图解 Stable Diffusion
最近有一篇国外博主分享的 图解Stable Diffusion 博客 写的非常的好,让你从零开始彻底搞懂图像生成模型的原理,我在这里给大家专业翻译整理一下。 正文开始 人工智能图像生成是最新的人工智能功能,令人惊叹不已(包括我的)。从文本描述中创造出...
-
Stable Diffusion【真人模型】:SD1.5人像模型新高度,超级逼真的AI真人模型:AWPortaint
今天和大家分享一个基于SD1.5基础模型训练的人像大模型AWPortrait。该模型在真人写实摄影方面效果超级逼真,能够模拟在真实摄影中的光影效果、皮肤纹理质感、甚至是人物的表情和妆容。 目前最新的版本是V1.4,在V1.3版本的基础上升级而来,对大模型...
-
AIGC实战:LLaMA2打造中文写作利器——数据准备与模型训练全攻略
目录 一、下载并加载中文数据集 二、中文数据集处理 1、数据格式 2、数据集处理之tokenizer训练格式 1)先将一篇篇文本拼凑到一起(只是简单的拼凑一起,用于训练tokenizer) 2...
-
AIGC提示词---如何写提示词?
你真的了解你的AI助手吗? 想象一下,你和别人使用相同的AI工具,但为何他的工作效率总是高出一截?秘诀可能就藏在那些看似简单的提示词里。精准的提示词是解锁AI潜能的关键,它们能让AI更好地理解你的需求,从而提供更准确、更高效的回答。 编写提示词,好比电...
-
AI绘画教程:Stable Diffusion中如何控制人像的姿势?
在AI绘画中,有时候我们需要主角(人物或动物)摆出特定的姿势,该怎么做呢? 第一种方法:以图生图 打开Stable Diffusion界面,点击imag2img 下面出现一个”drop image here or click to upload”...
-
腾讯推出新自研AI引擎:游戏研发效率提升超40倍
快科技7月30日消息,日前在ChinaJoy高峰论坛上,腾讯公司副总裁张巍表示,AI在游戏领域已经成为研发标配”。 腾讯于今年推出了新的自研AI引擎,能够让游戏场景制作、内容生成等领域的部分工作效率提升40倍以上。 据了解,腾讯是较早系统化布局AI研发的企...
-
AI绘图赚钱,普通人用Stable diffusion 还是Midjourney,他们有什么区别?
给大家用2000字说一下Stable Diffusion 和Midjourney 从前期部署→到操作生成→再到效果及应用,为你分析两者之间的区别。 SD控制性极强,可高度自定义,难度大,完全免费。 MJ对小白非常友好,图片质量高,模型有限,插件少,控制...
-
深度解读AIGC技术背后的算法原理
深度解读AIGC技术背后的算法原理 欢迎光临未来的文字工厂:AIGC的奇妙世界 想象力的火花:AIGC技术如何让创作焕发新生 从零到英雄:AIGC背后的核心算法简史 拨开云雾见青天:解密AIGC的算法基础 语言模型:词与句的舞蹈编排师 深...
-
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
【新智元导读】今早,所有开发者们被突如其来iOS18.1测试版砸晕了!没想到,苹果AI这就可以上手尝鲜了,一大波测评刷屏全网。更惊喜的是,苹果AI背后的基础模型47页技术报告,也一并上线了。 一大早,人们期待已久的「苹果AI」首个预览版,正式向开发者们推送...
-
当AI绘画 开始抢动漫人饭碗
每一次生产力的变革,在带来技术进步与更高效率的同时,也都无可避免地带来一次人才的更迭。在过去的几年里,人工智能取得了极快的发展,其中包括基于机器学习和深度学习的“图像生成技术”。ChatGPT4的出现,更是将AI 绘图降低到几乎零门槛,普通用户只需输入文本...
-
Stable Diffusion【应用篇】【手部修复】:SD手部问题修复大揭秘
在AI绘画中,手部问题一直是一个麻烦的问题。双手变形、手指缺失、手指多余这些问题常常困惑着我们。本文主要讨论一下关于Stable Diffusion中有哪些方法可以用于修复手部问题。 一. 素材准备 在文生图的功能界面生成一张有手部问题的图片。...
-
不是NVIDIA!苹果官宣AI模型训练用的谷歌芯片
快科技7月30日消息,苹果公司在其技术论文中透露,其人工智能系统Apple Intelligence所依赖的模型并非基于NVIDIA芯片,而是在谷歌设计的云端芯片上进行预训练的。 NVIDIA的GPU一直以高价位和高需求著称,是许多大型科技公司AI训练的首...
-
文生视频大模型,短视频的过弯点?
随着今年初Sora的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。 6月初,快手自研的视频生成大模型“可灵”正式上线。可灵AI采用了与Sora相似的技术路线,能够生成具有合理运动和模拟物理世界特性的视频。 截至目前,已有超百...
-
LLaMA-MoE:基于参数复用的混合专家模型构建方法探索
自Mixtral以来,大家对混合专家模型(Mixture-of-Experts,MoE)的关注越来越高。然而从零训练MoE模型的成本极大,需要耗费海量的计算资源。为此,我们探索了一种基于参数复用的MoE快速构建方法。 该方法首先将LLaMA...
-
llama 2 改进之 RMSNorm
RMSNorm 论文:https://openreview.net/pdf?id=SygkZ3MTJE Github:https://github.com/bzhangGo/rmsnorm?tab=readme-ov-file 论文假设LayerNorm...
-
一文速览Llama 3.1——对其92页paper的全面细致解读:涵盖语言、视觉、语音的架构、原理
前言 按我原本的计划,我是依次写这些文章:解读mamba2、解读open-television、我司7方面review微调gemma2,再接下来是TTT、nature审稿微调、序列并行、Flash Attention3.. 然TTT还没写完,7.23日...
-
AIGC生成式人工智能
AIGC生成式人工智能 什么是生成式AI,什么是AIGC?今天我们来详细的认识一下: 生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。...
-
手把手教你用聆思CSK6大模型开发板接入文心一言/千帆大模型
前言 多模态交互离不开硬件载体,近期有不少开发者在研究大模型开发板除了使用出厂示例自带的星火大模型,能不能接入文心一言、通义千问、豆包、智谱glm、kimi等国内的大模型,这个是必须支持的。但由于各家接口和数据格式不一样,有些朋友直接参考...
-
秘密打造「AI陶哲轩」 震惊数学圈!谷歌IMO梦之队首曝光,菲尔兹奖得主深度点评
【新智元导读】19秒破解几何难题,谷歌AI夺得IMO银牌在业界掀起了巨震。就连菲尔兹奖得主陶哲轩,前IMO美国队负责人罗博深都对此大加赞赏。更有AI大佬高调预测,若谷歌继续加码研究,应该可以造出一个「AI陶哲轩」。 谷歌DeepMind正在做的,是要打造出...
-
日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?
2024年的 AI 图像生成技术,又提升到了一个新高度。 技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6史诗级更新,后有开源巨头 Stable Diffusion3独领风骚,而 DALL・E3背靠 ChatGPT 这棵...
-
AI涌入巴黎奥运,颠覆观赛的黑科技大起底
巴黎人上一次在家门口看奥运,正好是100年前的事。 两届奥运会,世事大变迁,但「技术」始终是主角——1924年,巴黎举办第八届夏季奥运会。这届奥运会首次应用广播直播,极大扩大了赛事的观众范围。2024年,收音机已是“时代的眼泪”,但我们又在见证:技术变革如...
-
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。 杨红霞是AI领域知名科学家。她曾在IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016年加入阿里巴巴,就职于达摩院智能计算实验室;2023年3月入职字节跳动。 她在...
-
音频转文字哪家强?faster-whisper还是paddlespeech,我的折腾吐槽记录
前言 作为一个魔武双修的python程序员,面对产品小姐姐提出的需求。我只能迎难而上。 目前开源的音频转文字都有哪些?效果如何?速度怎么样?带着这一连串的问题,我在github的海洋里畅游良久。接下来我把我的发现都记录如下。 1. paddles...
-
AI大模型原理(通俗易懂版)——AIGC
传送门:AI大模型原理(通俗易懂版)-CSDN博客 AIGC 说起近期的热门科技词汇,AIGC当之无愧位列其中。从某一天开始,我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。 这些AI生...
-
阿里云OS Copilot:解锁操作系统运维与编程的智能助手
目录 引言 OS Copilot简介 OS Copilot的环境准备 创建实验资源 安全设置 设置安全组端口 创建阿里云AccessKey 准备系统环境 OS Copilot的实操 场景一、用OS Copilot写脚本和注释代码 ...
-
使用llama.cpp启动GPU模型计算
查询GPU使用状态: watch -n 0.5 nvidia-smi 使用GPU编译llama.cpp: make LLAMA_CUBLAS=1 用过make的记得删除项目,重新再以上执行命令,要不还...
-
这5款宝藏国产AI绘画工具,不允许有人还不知道!(建议收藏)
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~ 记得去年一位网友和我聊天的时候说到,“如果能用 AI 出一张图,我就心满意足了”。 这个...
-
Copilot有哪些功能?
微软的Copilot具备多种功能,旨在通过人工智能技术辅助用户更高效地完成工作。以下是Copilot的一些主要功能: 内容生成与编辑:Copilot能够生成文档摘要,重写内容,并修改现有的Word文档内容。 图片优化:它还能寻找适合文档的配图,并进...