-
大模型应用开发,AI 厂商开启新一轮“群雄逐鹿”?
价格战的硝烟似乎还没有平息,但 AI 厂商们的又一场战争已经开始。 这一次的竞争核心是大模型应用开发。根据 IDC 报告,2023年中国大模型平台及相关应用市场规模约还仅有区区17.65亿元人民币,但伴随着行业的巨变,2024年,模型应用开发相关的产业规模...
-
拿下诺贝尔化学奖,类谷歌AlphaFold开源蛋白质大模型
本周谷歌DeepMind联合创始人兼首席执行官Demis Hassabis凭借AlphaFold系列模型拿下诺贝尔化学奖,创造了AI大模型首次拿下诺奖的历史。 尤其是最新发布的AlphaFold-3在生物分子结构、蛋白-配体结构、生物复合体等方面获得了很大...
-
VBench评测第一,5周访问量暴增8倍多! 这款国产AI视频生成器「压番」Runway
家人们,这难道不是一部电影的切片? 来自@StevieMac03(I2V,图生视频) 谁能不被这头苏醒过来的小飞象萌化? 使用了图生视频(I2V)last frame功能,来自@alexgnewmedia 讲真,要不是在 X 上晃悠时突然被这几个视频...
-
KREA集结了AI视频的四大金刚,誓要做AI创作者的“POE”。
前天,Runway宣布把自己的API全量开放了,现在,人人都可以像接一个OpenAI的API一样,把AI视频接入到自己的产品中。 在20个小时之后,Krea.ai宣布正式上线一个集合站,能在这个产品里,一键使用Runway、Luma、可灵、海螺。 在K...
-
AI日报:百度发布一见视觉大模型v4.5;Adobe支持用AI做动画设计;Familia.AI推“复活亲人”软件
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、百度智能云一见视觉大模型v4....
-
大模型存储选型 & JuiceFS 在关键环节性能详解
从去年开始,LLM大语言模型领域发展迅速、如 LLaMA、ChatGLM、Baichuan、Qwen 和 yi-model 等基础模型(Foundation Models)的数量显著增加。众多企业也开始基于这些基础模型做 post-training 的相关...
-
大模型培训讲师叶梓:Llama Factory 微调模型实战分享提纲
LLaMA-Factory ——一个高效、易用的大模型训练与微调平台。它支持多种预训练模型,并且提供了丰富的训练算法,包括增量预训练、多模态指令监督微调、奖励模型训练等。 LLaMA-Factory的优势在于其简单易用的界面和强大的功能。用户可以在不编写...
-
Stable Diffusion安装教程(附安装包链接)
今天直接给大家上干货,安装包链接在最后!!! 安装 步骤 1.打开链接,可以看到这里边为大家提供了四个版本,N卡和A卡版本是为使用windows系统的朋友提供的。可以根据你的显卡型号选择下载。 2.N卡高端显卡附带秋叶大佬启动器,(里面附带启动...
-
【AI绘画教程】SD界面介绍—新手入门StableDiffusion全面了解SD的各个功能,从小白到大神轻松拿捏!!(含资料)
哈喽,大家好,我是程序员晓晓 写了这么久的AI绘画StableDiffusion方面的教程,最近还是有很多小伙伴说自己对于SD的各种用法不甚了解,那么今天就给大家说一下如何使用AI绘画Stable Diffusion的各个功能的作用 今天让大家轻松看懂...
-
【人工智能绪论】一次性搞懂什么是AIGC!
🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏:深度学习_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 🏀 专栏持续更新中~~~✨ 目录 1. 前言 2. AIGC发展历程...
-
开源语音实时交互新突破:LLaMA-Omni实现大语言模型无缝语音交互
像 GPT-4o 这样的模型通过语音实现了与大型语言模型(LLMs)的实时交互,与基于文本的传统交互相比,显著提升了用户体验。然而,目前在如何构建基于开源 LLMs 的语音交互模型方面仍缺乏探索。为了解决这个问题,我们提出了 LLaMA-Omni,这是一个...
-
Meta发布Llama 3.2,Llama 终于能看见了!
Llama家族再添新成员,多模态能力终于到来! Meta刚刚发布了Llama 3.2模型系列,包括多模态视觉模型和小型文本模型,共计10个开放权重模型。 这次更新不仅带来了期待已久的视觉能力,还为移动设备和边缘计算提供了更多选择。 多模态Llam...
-
什么是AIGC?什么是大模型?具体有什么应用?
什么是AIGC? AIGC,英文全称是Artificial Intelligence Generated Content,翻译成中文的大白话意思就是“人工智能生成的内容”。比如AI(Artificial Intelligence,人工智能)生成文本、图...
-
AI智能体到底该怎么搞,腾讯元器先打了个样
如果说2023年科技圈的关键词是“大模型”,那么到了2024年,大家更关心的就已经不再是大模型本身,而是能用大模型来干什么。在此前经历了喧嚣的“百模大战”之后,大模型的商业化成为了摆在国内AI厂商面前最重要的一个挑战,在目前的一众AI产品里,AI智能体(A...
-
LLaMA-Factory 让大模型微调变得更简单!!
背景 如果只需要构建一份任务相关的数据,就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作, 那么必将大大减轻微调工作量。 今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...
-
如何在AI绘画SD中调节光照?这2个超好用的方法别错过!轻松生成AI人像光感大片!
大家好,我是程序员晓晓 在AI绘画Stable Diffusion 摄影艺术中,灯光的运用对于照片的质量和情感表达至关重要。它不仅能够彰显主题,还能为画面增添深度与立体感,帮助传递感情,以及凸显细节之美。 下面,我将向大家展示二种灯光运用的技巧:...
-
从零预训练一个tiny-llama#Datawhale组队学习Task2
完整的教程请参考:datawhalechina/tiny-universe: 《大模型白盒子构建指南》:一个全手搓的Tiny-Universe (github.com 这是Task2的学习任务 目录 Qwen-blog Tokenizer(分词器...
-
国内外大模型汇总:Open AI大模型、Google大模型、Microsoft大模型、文心一言大模型、通义千问大模型、字节豆包大模型、智普清言大模型
Open AI大模型 特点: 多模态能力:如GPT-4o,能接受文本、音频、图像作为组合输入,并生成任意形式的输出。 情感识别与回应:具备情感识别能力,能根据对话者的情绪做出有感情的回应。 几乎无延迟:对音频输入的响应时间极短,与人类对话相似。...
-
效率暴涨!5 款设计师必备的 Stable Diffusion WebUI 模型,三分钟十张图,再也不用熬夜加班了!
大家好,我是画画的小强 今天继续为大家推荐 5 款优质的设计类 Stable Diffusion WebUI 风格模型,包含电商设计、产品摄影、矢量扁平插画、古风工笔等多种风格。 一、设计 | 电商展台 这是一款非常优秀的电商展台设计模型,包含极简...
-
OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本
10月2日消息,美东时间10月1日OpenAI举行了年度开发者大会DevDay,推出系列新工具,包括四大创新:实时API(Realtime API)、视觉微调(Vision Fine-Tuning)、提示词缓存(Prompt Caching)、模型蒸馏(M...
-
调用大模型API-文心一言
一、准备工作 进入百度智能云千帆大模型平台,点击应用接入-创建应用;按提默认完成创建 二、开始使用 单轮调用 进入API列表 - ModelBuilder以第一个ERNIE-4.0-8K为例,选择“HTTP请求调用”,把第一步创建应用的 应用A...
-
什么是Agentic RAG?
Agentic RAG是检索增强生成(Retrieval-Augmented Generation, RAG 技术的一种高级形式,它通过引入人工智能代理(Agent 的概念,为语言模型赋予了更高层次的智能和自主性。以下是Agentic RAG的主要特点和优...
-
Stable Diffusion & ComfyUI(一)
前言 我是 Porterxie,一位对技术充满好奇的程序员。最近,我对 Stable Diffusion(下文中统称为 SD)以及 ComfyUI 进行了初步的学习和研究,想在这里分享下学习过程中的一些经验及理解。 在此之前,人工智能对我来讲,完全是一...
-
如何利用 Whisper 模型进行多语言语音识别的优化和定制?
关注我,持续分享逻辑思维&管理思维&面试题; 可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导; 推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容。一顿烧烤不到的费用,让人能紧跟时代的浪潮。从普通网站,到公...
-
llama factory LoRA微调qwen大模型 | 新手炼丹记录(1)
往期回顾 llama factory LoRA微调qwen大模型 | 新手炼丹记录(1 -CSDN博客 大模型使用llama.cpp转换gguf格式并量化 | 新手炼丹记录(2 -CSDN博客 oll...
-
【丹摩智算实战】手把手教你Llama 3.1 8B部署:开启自然语言处理新篇章
前言 在自然语言处理(NLP)领域,大模型(LLM)的发展日新月异,为各种应用场景带来了前所未有的能力。近日,Meta公司宣布推出了其最新的开源模型——Llama 3.1,这一消息在行业内引起了广泛关注。本文将详细介绍Llama 3.1的背景、特点、部...
-
AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM ,名为AMD-135M”。 相比于越来越庞大的大语言模型(LLM ,它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。 AMD-135小模型隶属于Llama家族,有两个版...
-
LLM大模型之Rag检索增强生成演变成GraphRAG
RefAug:prompt增强训练LLM https://github.com/ytyz1307zzh/RefAug Learn Beyond The Answer: Training Language Models with Reflect...
-
Windows安装docker,启动ollama运行open-webui使用AIGC大模型写周杰伦歌词
Windows安装docker,启动ollama运行open-webui使用AIGC大模型写周杰伦歌词 1、下载docker的Windows版本。 docker下载地址: https://docs.docker.com/desktop/insta...
-
【AI绘画教程】ComfyUI基础篇:小白都可以学会的ComfyUI安装教程(原生版安装包)
大家好,我是程序员晓晓 自从Flux这一款最新黑马文生图模型推出以来,Flux的浪潮正以不可阻挡之势席卷全球,目前本地电脑环境要玩Flux, 支持方式主要是ComfyUI。但是ComfyUI工具安装一直是很多小白比较困惑的地方,在和小伙伴的私下留言中,C...
-
使用Ollama本地部署Llama 3.1大模型
Llama 3.1 介绍 2024 年 7 月 24 日,Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,Llama 3.1 405B 支持上下文长度为 128K Tokens, 增加了对八种语言的支持,号称第一个在常识、可...
-
Meta Llama 3介绍及其关键技术
随着深度学习算法的突破和发展,语言模型已经成为连接人与机器的重要桥梁。在这一领域中,Meta的Llama 3 作为最新一代的大规模预训练模型,凭借其卓越的性能和广泛的应用前景,正逐渐成为行业内的佼佼者。 Llama 3 的研发团队继承了前代模型的技术优势...
-
AI绘画,Stable Diffusion时尚版《黑神话:悟空》怎么做?
前言 我也来蹭热点了,虽迟但到。 这期分享Stable Diffusion《黑神话:悟空》时尚版悟空和海边的二师兄的AI教程。 本次教程使用哩布哩布AI网站在线生成,本次教程只使用文生图功能。 所有的AI设计工具,模型和插件,都已经整理好了...
-
大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」
大神卡帕西墙裂推荐! 甚至预言这个AI应用,有可能开启「和ChatGPT一样大的机会」。 它就是来自谷歌的实验性AI产品,Notebook LM,背后由谷歌现在最强大的模型Gemini1.5Pro提供支持。 最近这应用要多火就有多火,全因上线了一项新功能...
-
Meta的新眼镜Orion,就是下一代消费级AI设备的“GPT3时刻”
2024 年 9 月 25 日,Meta发布了Orion眼镜,这个日子在科技产品交互史上来说,可能与GPT3 发布那天在AI发展史上的地位一样。 它们都不是马上落地的产品,但都第一次真正给一个长期被期待又长期被“怀疑”的技术指明了方向,并做出了你可以用到和...
-
免费使用文心一言会员教程,获取1个月兑换码
只需简单几步,就能享受一个月的会员特权!✨ 👉 一、点击文心一言,邀请登录页面 点击 https://yiyan.baidu.com/fissileInvite?utm_invite_code=PHsgcLZakyOp4JzqA1itog%3D%3D&...
-
支小宝,生于人人需要“AI牛马”的时代
《钢铁侠》中的贾维斯,是大多数人对AI助手的初印象。只需一个简单指令,贾维斯就能迅速准确地做出相应动作,无数次拯救钢铁侠于危难之际。 回到现实,虽然不是每个人都能拥有钢铁侠的“钞能力”,打造一个专属于自己的贾维斯。但要拥有一个能够解决生活琐事、提高生活效率...
-
重磅!美国取消SB-1047法案,OpenAI、谷歌、Meta大难不死!
美国加州州长Gavin Newsom在今天凌晨正式否决——SB-1047法案! 值得一提的是,过去30天Gavin一共签署了17个关于监管大模型、生成式AI安全使用的法案,唯独否决了1047,看来他也不是一个糊涂人。 在这个积极否决的过程中,AI界泰斗-吴...
-
3天把Llama训成Mamba,性能不降,推理更快!
近日,Mamba方面又搞出了有意思的研究:来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。\ 先来看一张其乐融融的图片(一眼AI): 右边的小羊驼代表Llama,而左边的蛇(...
-
Windows环境下部署本地大模型教程
自ChatGPT在2022年爆发式出圈以来,大模型对人类世界产生了重大影响,无论是在生产、工作、写作方面还是自动驾驶领域,大模型发挥了非常重要的作用。 现各大厂,无论是国内大厂还是国外大厂,都纷纷推出了自己的对话大模型供人们免费或付费使用。与此同时,开源...
-
AI一键批量生成各类短视频,自动批量混剪短视频,自动把视频发布到抖音,快手,小红书,视频号上,赚钱从来没有这么容易过! 支持本地语音模型chatTTS,fasterwhisper,支持云语音
最近MoneyPrinterPlus比较火,可以自动生成视频,剪辑视频,而且还可以直接上传到多媒体平台上!!! 赶紧自己动手实操一下吧。 1、首先安装好需要的环境。 Python 3.10+,安装地址:直接跳转到下载页面 ffmpeg 6.0+,123网盘...
-
AI视频新战场:字节对决快手、反击Sora
字节跳动以性价比策略切入市场,掀起价格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。 一场由Sora引发的AI视频生成竞赛,如今迎来新的竞争者! 9月24日,2024火山引擎AI创新巡展...
-
支付宝进军大模型医疗应用,技术一号位:我们有4个切入点
面对来势汹汹的大模型应用浪潮,支付宝医疗技术一号位魏鹏这样说道。 今年,蚂蚁大举进军医疗,已是再明显不过。作为蚂蚁大模型应用三大领域之一(其余是金融与生活),落地进展显得尤为瞩目。 模型层面,支付宝医疗大模型,在中英文医疗考试、基准测试达到甚至超过GPT-...
-
AIGC大模型扩图:Sanster/IOPaint(4)
AIGC大模型扩图:Sanster/IOPaint(4) 用大模型实现AI扩大一张图的周边区域,变得更大,当然必须契合原图,和原图浑然一体。 1、这次模型换用 Sanster/PowerPaint-V1-stable-diffusion-inp...
-
2024年50个热门LoRA模型推荐-Stable Diffusion
2024年50个热门LoRA模型推荐-Stable Diffusion 使用 Stable Diffusion 创作绘画作品,我们可以借助checkpoint、Lora 和 embeddings 等模型,提升AI的绘画质量和创造力。本文将根据评分、下载...
-
Copilot,Cursor和通义灵码:到底谁才是你的最强代码助手?
近期基于大语言模型诞生的代码辅助助手可谓层出不穷,从一开始的github copilot, tabnine到现如今的cursor大火,到底谁才是代码辅助的最强王者呢?我希望就我近期的体验带大家初步认识一下他们(仅代表个人见解) 本文将介绍以下几个工具:...
-
百度Ernie大模型是什么?
百度的Ernie模型(Enhanced Representation through kNowledge Integration)是一个基于Transformer架构的预训练语言模型。它由百度研发,旨在通过整合大规模语料和知识图谱来增强模型的语言理解和生成...
-
华为推出业界首个品宽大模型:迈向L4自动驾驶
快科技9月28日消息,在2024中国国际信息通信展会期间,华为光接入领域总裁冯志山在全光宽带高质量发展论坛发表了加速F5G-A万兆光网商用,迎接智能时代新机遇”发言。 他指出,各类AI智能应用的快速涌现,驱动光宽产业加速向万兆光网演进,F5G-A万兆光网发...
-
ERROR: Failed to build installable wheels for some pyproject.toml based projects (llama-cpp-python)
Building wheels for collected packages: llama-cpp-python Building wheel for llama-cpp-python (pyproject.toml ... error erro...
-
一家AI声音克隆公司,借三只羊录音门玩起了“自杀式营销”?
只羊事件闹得沸沸扬扬,没想到受害者竟然是AI。 昨晚,合肥警方就“三只羊集团创始人卢文庆录音事件”发布通报,称这条广为流传的音频为AI生成,犯罪嫌疑人已经被依法采取刑事强制措施。 一锤定音,这条通报不仅给出了官方表态,也扇了前几天那位网传“国内AI第一人”...