-
码住这款图片处理神器!一键搞定图片尺寸修改,效率翻倍!
Hey,设计界的小伙伴们!你是否还在为不同平台的图片尺寸要求而烦恼?证件照、产品图、社交媒体配图...尺寸不一,手动修改简直让人头大。别急,今天我要分享一个超给力的免费工具—千鹿设计助手,让你的图片处理工作变得轻松又高效! 功能优势: 1. 一键批量改...
-
MSRA古纾旸:2024年,视觉生成领域最重要的问题有哪些?
文章链接: https://arxiv.org/pdf/2407.18290 亮点直击 概述了视觉生成领域中的各种问题。 这些问题的核心在于如何分解视觉信号,其他所有问题都与这一核心问题密切相关,并源于不适当的信号分解方法。 本文旨...
-
Whisper Android 项目使用教程
Whisper Android 项目使用教程 whisper_androidOffline Speech Recognition with OpenAI Whisper and TensorFlow Lite for Android项目地址:https...
-
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南 stable-diffusion.cppStable Diffusion in pure C/C++项目地址:https://gitcode.com/gh_mirrors/st/...
-
一文看懂llama2(原理&模型&训练)
Llama2(大型语言模型2) Llama2(大型语言模型2)主要基于近年来火爆的Transformer架构。下面是Llama2的几个核心原理: Transformer 架构: Llama2采用了Transformer网络,它通过自注意力机制来处理...
-
T-Eval:大模型智能体能力评测基准解读 | ACL 2024
AI Agent(智能体)作为大模型的重要应用模式,能够通过使用外部工具来执行复杂任务,完成多步骤的工作流程。为了更全面地评估模型的工具使用能力,司南及合作伙伴团队推出了T-Eval评测基准,相关成果论文已被ACL 2024主会录用,点击链接可查看原文:h...
-
掌握 Llama 3.1:轻松本地部署与远程使用的全攻略
前言: Llama 3.1 是 Meta(Facebook 的母公司)发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B(80 亿参数)、70B(700 亿参数)和 405B(4050 亿参数)模型。其中,405B 是 Meta 迄...
-
AIGC: 5 IT从业者如何使用AI赋能业务?
上图是一个使用AI生成的图片, 描述一下这篇文章的背景。 程序员系统学习了OpenAI提供的api接口,并熟练利用提示词结合业务解决业务问题。 现状 讲一个故事来开始今天的内容。 架构师老李在技术圈里以其卓越的技术洞察力而著称。另一边,Carter...
-
vllm 聊天模板
vllm 聊天模板 背景 如何使用chat template generation prompt & add_generation_prompt chat templates的额外输入 工具使用 / 函数调用 Chat Template...
-
Stable Diffusion最新XL版发布,最简单的一键安装包也升级了
7月初,Stable Diffusion发布了XL版及两个模型,当时仅有个别图形界面工具支持,如ComfyUI,操作不便,且很多常用插件无法使用。 最常用的WebUI并未第一时间支持。 前几天,WebUI在开发者模式支持XL的模型,很多绘画爱好者一拥而...
-
如何在本地运行Llama 3系列:完整指南
今天咱们来聊聊 AI 界的重要事情——那些像 Llama3 系列这样的超大型语言模型(LLMs),现在居然可以在咱们自己的地盘上运行啦!想象一下,这就像是把一个超级智能的助手请进了家门,而且还是私密的,不用担心信息泄露的问题。 本文,虽然是基于之前 Ll...
-
大模型格局变天:Llama3.1 诞生
前言 相信大家翘首企盼的都是同一个主角,Meta藏到现在的王牌、最被社区看好能直接叫板GPT-4o的新一代开源大模型—Llama 3.1系列,终于正式发布了。 鉴于4月公开的两个Llama 3小参数模型8B和70B表现不俗,令开发者们对*参数版本的强...
-
AI绘画Stable Diffusion基础教程!
Ai绘图真的太火了,挡都挡不住。本着“不断好奇,不停学习”的理念,我打算介绍下Stable Diffusion,有兴趣的小伙伴可以一起学习。 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一...
-
多模态合规分析平台,保障AIGC营销新时代对客服务高质合规
随着生成式人工智能技术加速应用于人类日常生产生活,AIGC(人工智能生成内容)正逐渐成为营销领域的新选择。 与此同时,全渠道数字化时代来临,企业与客户的互动形式更加丰富,包括线上营销平台、私域微信运营、5G视频客服等多形态媒介,沟通更加频繁,营销素材的影...
-
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...
-
Datawhale Al夏令营 AIGC方向 task2
1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...
-
Flux.1 版本又更新,更快更省显存,画质依旧美丽!
小伙伴们都知道 Flux.1 的出图效果很棒,但是对电脑的配置要求也同样很高,随便就要十几 G 显存才能体验,光这配置就劝退了很多小伙伴。 硬件要求真的是硬伤,不过地球是圆的,技术也总是在发展的,就在这几天,ControlNet 的作者张吕敏大大带着他的...
-
Midjourney提示词-动物系列-50
an anthropomorphic horse hyperdetailed photography, Hyperdetailed, Unreal Engine, Cinematic Lighting, Blacklight, Photorealistic...
-
AIGC:开启智能创作新时代
一、AIGC 的兴起与发展 AIGC 的兴起与发展 AIGC 的兴起是多种因素共同作用的结果。从技术层面看,深度学习算法的不断优化,如 Transformer 架构的出现,使得模型能够处理更复杂的数据和任务,为 AIGC 的发展提供了强大的技术支撑。预...
-
Datawhale 魔搭 AI夏令营 第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习
AI生图的能力与局限 AI生图的原理 AI利用 深度学习技术来训练神经网络,训练过程中,神经网络会学习到真实图像中的纹理、结构、颜色等特征,并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后,通过输入关键提示词来让模型...
-
本地部署,Whisper: 开源语音识别模型
目录 简介 特点 应用 使用方法 总结 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Reco...
-
Stable Diffusion WebUI 1.10.0来了
大家好,我是每天分享AI应用的萤火君! 前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:...
-
ComfyUI中的sam模型国内下载方法
was-node-suite-comfyui这个节点安装的时候,有它内部的config配置文件,里面其实给了一些下载地址,配置文件里是这么写的: "sam_model_vith_url": "https://dl.fbaipublicfiles.com/...
-
Zed AI有哪些功能免费吗?人工智能代码生成怎么使用方法详细教程指南
Zed AI 是什么? Zed AI是一个集成到编程工作流中的插件,通过与大型语言模型(LLMs)的直接对话,增强了代码生成、转换和分析的能力。它提供了多种交互方式,包括助手面板、斜杠命令、内联助手和提示库,以提高开发效率。Zed AI还支持多种LLMs提...
-
使用langchain4j调用大模型写个聊天助手
LangChain4j是一款基于Java的高效、灵活的AI大模型应用框架,专为简化Java应用程序与LLMs(大语言模型)的集成而设计。它提供统一API和模块化设计,支持多种LLM提供商和嵌入模型,以及丰富的工具箱,如AI服务和RAG(检索增强生成)。La...
-
如何确保AI写作质量上乘? 笔灵AI,强大模型支撑,精准高效
在这个信息爆炸的时代,写作技能如同一把钥匙,为每个人开启知识的大门。然而,当我们凝视着空白的纸张或屏幕上的光标时,往往感到无从下笔,仿佛置身于创作的荒漠。但请放心,我有一个好消息要告诉你:那就是笔灵AI写作——你的智能写作伙伴!它如同一位无形的导师,随时准...
-
ECCV2024中有哪些值得关注的扩散模型相关的工作?
Diffusion Models专栏文章汇总:入门与实战 The Fabrication of Reality and Fantasy: Scene Generation with LLM-Assisted Prompt Interpretation...
-
AI日报:新壹视频大模型2.0发布;LivePortrait支持用图片控制动画;OpenAI推GPT-4o模型微调功能;免费无水印!AI视频Hotshot最长可生成10秒
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、新壹视频大模型2.0发布:支持...
-
一文搞定大模型备案
《生成式人工智能服务安全基本要求》背景 1.1.基本要求对应的流程和介绍 "生成式人工智能服务安全基本要求"是针对"生成式人工智能(大语言模型)上线备案"流程制定的标准,这一流程也被称作"大模型上线备案"。这是继"生成合成(深度合成)类算法备案"之...
-
使用llama factory对语言模型微调,重塑自我认知,并部署于ollama上
本文记录了从环境部署到微调模型、效果测试并部署的全过程。 一 环境 如果使用autodl租赁服务器则不需要如下步骤,但是请注意llama_factory需要python、cuda等版本满足: 首先请确报你已经安装好了conda工具...
-
真我13 Pro系列将搭载AI超清功能 模糊照片一键清晰
真我手机品牌今日宣布,真我13Pro系列搭载了先进的AI超清功能,旨在彻底解决照片模糊的问题。官方自信宣称,这项技术能让用户告别模糊照片,实现一键将废片变为超清大片,让世界再无模糊影像。 真我13Pro系列的摄影能力得到了显著提升,首发搭载了索尼LYT-6...
-
AIGC学习笔记
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 提示:这里可以添加本文要记录的大概内容: 记录一下学习AIGC,参考链接: 爆火的AIGC到底是什么 提示:以下是本篇文章正文内容,下面案例可供参考 一、stab...
-
Python虚拟环境:使用venv隔离项目依赖
前言 在开发Python项目时,管理项目的依赖关系是一个常见的挑战。不同项目可能需要不同版本的库,如果不加以管理,很容易导致依赖冲突和环境混乱。幸运的是,Python提供了虚拟环境(virtual environment)的解决方案,帮助我们隔离项目依...
-
Llama中文大模型-模型微调
同时提供了LoRA微调和全量参数微调代码,关于LoRA的详细介绍可以参考论文“[LoRA: Low-Rank Adaptation of Large Language Models](https://arxiv.org/abs/2106.09685 ”以及...
-
即刻体验 Llama3.1就在Amazon Bedrock!
引言 在人工智能的浪潮中,大型语言模型(LLMs)不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列,以其卓越的性能和广泛的应用前景,引起了业界的广泛关注。现在,激动人心的消息来了——Llama3.1 已经在 Amazon Be...
-
手握15个大厂offer,我在大模型风口起飞
猎聘的一份报告显示,2024年一季度国内生成式人工智能的相关职位数同比增321.7%。其中,50万以上的年薪段增速最快,超过500%。 大厂需要前5%的顶尖人才去完成“95%的人无法完成的事情”,并不惜为此开出丰厚报酬。 生成式人工智能岗位急增300%以上...
-
stable diffusion--小白学习步骤
1.看一下Unet网络的讲解_哔哩哔哩_bilibili,了解Unet网络 2.看一下【生成式AI】Diffusion Model 原理剖析 (1/4 _哔哩哔哩_bilibili,起码要看前3/6个视频 3.看一下超详细的扩散模型(Diffusion...
-
AI重走西游路,原来《黑神话:悟空》才是终极导航
在写这篇文章之前,我恋恋不舍的关掉了《黑神话:悟空》。 从中午睡醒,忙完了手上一堆工作,且进行了九九八十一难的第一难解压之后,晚上我爽玩了5个小时。 目前进度快把第一章给通了,打完了黑风大王,就剩一个关底BOSS黑熊精了。 真的爽,真的好玩,上一次让我如...
-
秋叶V4.9整合包发布!什么是Stable Diffusion?如何安装Stable Diffusion?
Stable Diffusion秋叶整合包,一键安装Stable Diffusion,门槛极低,完全免费,支持Nvidia全系列显卡。 来自B站up主秋葉aaaki近期推出的Stable Diffusion整合包v4.9版本,能够让零基础用户轻松在本地部...
-
利用多Lora节省大模型部署成本|得物技术
一、背景 近期,我们在大模型集群的部署过程中遇到了一些挑战。公司有多个业务场景,每个场景都基于自身的数据进行微调,训练出相应的大模型并上线。然而,这些场景的调用量并不高,同时大模型的部署成本较为昂贵,这造成了资源的浪费。 本文将介绍我们如何利用多Lor...
-
每天免费100万token,GPT-4o新增微调功能
OpenAI向所有开发者推出GPT-4o数据微调功能,可以使用自己的数据打造准确率、输出模式更好的个性化ChatGPT助手。 例如,韩国最大电信运营商SK Telecom通过OpenAI的数据微调功能,打造了特定的AI助手,使对话总结准确率提高了35%,意...
-
【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人
系列篇章💥 No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
stable diffusion 的四种换脸方法
前言: 很多人对ai 换脸换装都比较感兴趣,今天就记录一下目前主流的换脸方法!! 一、Roop插件 1.安装方法 roop安装及失败解决教程,你还没玩sd的换脸吗?_哔哩哔哩_bilibili 借用b站一个博主的视频教程,简单快捷方便 gi...
-
在 RAGFlow 中实践 GraphRAG
RAGFlow 0.9 版本发布,正式引入了对 GraphRAG 的支持。GraphRAG 由微软近期开源【参考文献1】,被称作下一代 RAG,并且在更早时间发表了相关论文【参考文献2】。关于下一代 RAG,在 RAGFlow 体系的定义更加完整,就是如下...
-
基于腾讯云高性能应用服务 HAI 搭建并使用 AI 模型 StableDiffusion 进行文生图
基于腾讯云高性能应用服务 HAI 搭建并使用 AI 模型 StableDiffusion 进行文生图 HAI是什么 高性能应用服务 HAI 与传统 GPU 云服务器 区别 使用高性能应用服务HAI 一键部署 StableDiffusion AI...
-
MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions
Paper name MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions Paper Reading Note Paper URL: ht...
-
AIGC文生图方向Task2笔记:探索AI生图的前沿、历史、难点与挑战
AIGC文生图方向Task2笔记:探索AI生图的前沿、历史、难点与挑战 引言 在AIGC(Artificial Intelligence Generated Content)的广阔领域中,文生图(Text-to-Image Generation)技术以其独...
-
江大白 | 视觉Transformer与Mamba的创新改进,完美融合(附论文及源码)
本文来源公众号“江大白”,仅用于学术分享,侵权删,干货满满。 原文链接:视觉Transformer与Mamba的创新改进,完美融合(附论文及源码) 以下文章来源于微信公众号:AI视界引擎 作者:AI引擎 链接:https://mp.weixin.q...
-
Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记
大纲 一、前言 二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成(图片及对应标签) 2.4 设置data-juicer 配置文件并执行,处理metadata.jsonl文件生成result....
-
ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货)
原文链接: ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货) (chinaz.com Instant ID 是 controlnet 比较新的一个模型,主要作用也是固定人物的面部特征。它可以仅通过一张图片进行完美换脸,可能是...