-
【技术前沿】Flux.1部署教程入门--Stable Diffusion团队最前沿、免费的开源AI图像生成器
项目简介 FLUX.1 是一种新的开源图像生成模型。它由 Stable Diffusion 背后的团队 Black Forest Labs 开发。 官网中有以下功能开源供大家参考: FLUX.1 擅长在图像中准确再现文字,因此非常适合需要清晰文字或...
-
RAG 入门指南:从零开始构建一个 RAG 系统
本文正文字数约 3300 字,阅读时间 10 分钟。 从零开始构建一个应用可以让我们快速理解应用的各个部分。 这个方法其实非常适用于 RAG。 我在以前的文章中有介绍过 RAG 的概念、原理以及应用等,但其实,亲自动手来构建一个 RAG 系统或许能够...
-
Llama 3.1 405B:4050亿参数史上最强开源大模型
01 。 概述 Meta公司推出了其最大的开源人工智能模型——Llama 3.1 405B,拥有4050亿个参数,与GPT-4o和Claude 3.5 Sonnet相媲美。该模型在16000个Nvidia H100 GPU上训练而成,现已在云平台上可用,...
-
K8sGPT 搭配 LLaMA 3.1:8B,AI 运维也能轻松搞定
文章目录 1. 前言 2. 安装工具 3. 运行 k8s 集群 4. 运行本地 llama 模型 5. k8sgpt 模型认证管理 5.1 添加 openAI 模型认证 5.2 添加本地 llama3.1:8b模型认证 5.3 删除模型认证...
-
Stable diffusion: AttributeError: module ‘jax.random‘ has no attribute ‘KeyArray‘
错误提示 安装from diffusers import StableDiffusionPipeline 提示错误 AttributeError: module ‘jax.random’ has no attribute ‘KeyArray’...
-
《史上最简单的SpringAI+Llama3.x教程》-05-打破界限,Function Calling在业务场景中的应用
什么是Function Calling Function Calling 是一种技术,它允许大型语言模型(如GPT)在生成文本的过程中调用外部函数或服务。 这种功能的核心在于,模型本身不直接执行函数,而是生成包含函数名称和执行函数所需参数的JSON,...
-
使用 Ollama、Llama 3.1 和 Milvus 进行函数调用案例
偶然看到一篇很短代码就能实现llama function call的文章。 秉着学习加分项的原则,进行了实验测试。这里给出案例和全部改写后的代码。 将 LLM 与函数调用相结合,就如同赋予您的 AI 连接世界的能力。通过将您的 LLM 与外部工具(例如用...
-
无需本地部署!免费使用开源大模型API
之前,我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说,给本地大模型添加知识库、API的调用等等。 在这个过程中,有粉丝反馈自己不会部署,或者电脑配置不好,想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种...
-
8G显存运行Llama 3.1 405B!
我正在接受挑战,在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB!这是 8GB VRAM 容量的 103 倍! 显然,8GB VRAM 无法容纳它。那么我们如何让它工作呢?...
-
如何本地搭建Whisper语音识别模型
如何本地搭建Whisper语音识别模型 如何本地搭建Whisper语音识别模型 1. 引言 Whisper模型简介 本地搭建的意义和应用场景 应用场景包括但不限于: 2. 环境准备 系统要求 Python环境安装 依赖库安装 3. 安...
-
探索音频转文字的高效之道:whisper-rs项目解析与应用
探索音频转文字的高效之道:whisper-rs项目解析与应用 whisper-rsRust bindings to https://github.com/ggerganov/whisper.cpp项目地址:https://gitcode.com/gh_...
-
在线体验阿里云的通义万相(AIGC)文本绘图与人像美化功能
介绍 阿里云的通义万相AIGC技术为Web服务带来了图像生成的全新境界。想象一下,仅凭一段文字描述或随手涂鸦,就能转换为专业级的图像作品,包括人像风格重塑和定制写真等。这不仅加速了创意流程,也为广告、教育、游戏等行业带来视觉升级,满足个性化视觉内容需求...
-
抖音豆包大模型AI写作教程
简数采集器支持调用字节跳动抖音的豆包AI大模型API接口,用于对采集的数据进行研究分析,内容写作等。 抖音豆包大模型AI写作使用教程: 目录 1.启用豆包AI大模型API功能 2.设置豆包API处理规则 3.应用API规则处理数据 4.获取AI...
-
ToB Or ToC,大模型不做“选择题”
在AI大模型的商业化道路上,“ToB or ToC”一直是两难的选择。不过,AI业内有一个共识,创业公司在C端更容易找到机会,而互联网大厂则更能通过B端获得规模优势。 但目前来看,这一共识可能要被打破了。一直被认为是“To C主义者”的月之暗面,近日官宣将...
-
阿里重磅开源Qwen2-VL:能理解超20分钟视频,媲美GPT-4o!
阿里巴巴开源了最新视觉多模态模型Qwen2-VL,根据测试数据显示,其72B模型在大部分指标超过了OpenAI的GPT-4o,Anthropic的Claude3.5-Sonnet等著名闭源模型,成为目前最强多模态模型之一。 Qwen2-VL支持中文、英文、...
-
生成式AI,搜索赛道的又一个黄金十年
随着生成式AI的发展,搜索引擎正在被重构,越来越多玩家开始布局AI搜索赛道。 一方面,传统搜索引擎/浏览器正借助AI技术的重构重新焕发生机,无论是移动端还是PC端,都在抢占更多的搜索流量。 比如7月,阿里旗下夸克升级“超级搜索框”,推出以AI搜索为中心的一...
-
智谱AI静悄悄的上线了一大波新模型,过年了,真的。
智谱29日下午在KDD2024上面,悄咪咪的上线了一堆的超级更新。 我真的服了,我本来今天从泰国回来,准备休一天假的,结果晚上又坐在电脑面前被迫营业。 他们总是每次,静悄悄的就把4个2给扔出去了。 嗯,就一场演讲了,发布了一堆新模型还有新功能,个顶个都很...
-
开源项目:Stable Diffusion Prompt Reader 教程
开源项目:Stable Diffusion Prompt Reader 教程 stable-diffusion-prompt-readerstable-diffusion-prompt-reader - 一个简单的独立查看器,用于在Web UI外部读取...
-
llama.cpp使用
llama.cpp的github库地址为ggerganov/llama.cpp: LLM inference in C/C++ (github.com ,具体使用以官方说明为准。 简介 llama.cpp目标是在本地和云端的各种硬件上以最小的设置和最...
-
超越传统续写模式:AI 编程距离智能研发终态还有多远?
在软件开发领域,大模型驱动的智能代码生成技术已成为研究热点,引起了广泛关注和探索。在7月27日,由开源中国主办的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动,来自百度工程效能部的前端研发经理杨经纬,从一款 AI 编程助手 —— 文心快...
-
Whisper-TikTok 使用指南
Whisper-TikTok 使用指南 Whisper-TikTokFrom AI tools to TikTok video creation using FFMPEG, Microsoft Edge read aloud and OpenAI Wh...
-
Q-Copilot,基于Java+NapCatQQ+LLM+Tools构建的全新QQ AI机器人,打造私人助理,支持邮件发送,超级详细!!!
Q-Copilot简介 传统的QQ机器人可以说几乎对自然语言没有理解能力,只能通过固定指令的方式进行特定任务是执行。比如查询天气,你只能说"天气 深圳","01 深圳",等类似固定指令,不管是从开发角度还是用户角度都极其机械化。...
-
讯飞大模型,还在投入期
今年,国内大模型进入到了商业化提速的新阶段。纯粹讲技术的公司越来越少,取而代之的是落地。为了寻找相对确定性的变现模式,许多玩家仍延续互联网时代的经验,按图索骥般地在B端和C端摸索新技术与经营的边界。 在这其中,科大讯飞尤为特殊,其身上不仅充斥着跨越两个AI...
-
开源智能助手平台Dify是什么?
1.背景 对于国内小公司,怎样通过Ai 将内部流程、产品重新做一次,从而提高人效、给客户带来价值,这是老板们在考虑的问题 ? 当前市面上的你大模型例如:通义千问、文心一言、kimi、智谱清言、盘古 等,底层能力都非常强大(千亿级参数),但各个模型使用有...
-
百度文心一言API调用,千帆大模型获取API Key和API Secret图解
百度文心一言大模型调用教程,获取文心一言API Key和API Secret的方法,码笔记mabiji.com告诉大家在百度智能云的千帆大模型平台创建应用,即可获取文心一言的API Key和API Secret,详细流程如下: 1、在百度智能云的千帆大模...
-
使用gradio部署微调后的模型
文章目录 概要 整体架构流程 技术细节 小结 概要 使用gradio部署微调后的模型 整体架构流程 gradio前期学习,以下是一些常见的输入输出组件,有些即可输入也可输出 gr.Audio(sources=['mi...
-
在LangChain中使用Llama.cpp:从安装到实践
在LangChain中使用Llama.cpp:从安装到实践 引言 Llama.cpp是一个高效的C++库,用于在CPU上运行大型语言模型(LLMs)。本文将介绍如何在LangChain中集成和使用Llama.cpp,包括安装、设置以及使用LLM和嵌...
-
Whisper-Streaming:实时语音转写与翻译的革命性工具
Whisper-Streaming:实时语音转写与翻译的革命性工具 whisper_streamingWhisper realtime streaming for long speech-to-text transcription and transl...
-
Bili.Copilot 开源项目教程
Bili.Copilot 开源项目教程 Bili.Copilot哔哩哔哩用户的个人助理项目地址:https://gitcode.com/gh_mirrors/bi/Bili.Copilot 项目介绍 Bili.Copilot 是一个基于开源技术构...
-
大模型框架汇总:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel
常见的大模型框架:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel: 大模型框架是指用于训练、推理和部署大型语言模型(LLMs)的软件工具和...
-
4060显卡+LLaMA-Factory微调LLM环境准备——(一)安装cuda
本地配置 系统:win10**硬件:**i5-12490f+RTX4060 安装原因: 最近尝试在本地对开源LLM进行Fine-tune的时候,用到了LLaMA-Factory,在运行的时候,弹出未检测到GPU,后来才发现,是忘记安装cuda等...
-
探索GitHub Copilot的深度洞见:Copilot Metrics Viewer全面解析
探索GitHub Copilot的深度洞见:Copilot Metrics Viewer全面解析 copilot-metrics-viewerTool to visualize the Copilot metrics provided via the...
-
LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设
模型越来越大,需要的 GPU 越来越多;与此同时 GPU 性能也在不断增强,配套的网络带宽也不断增加到 400G(Blackwell GPU 甚至需要到 800 Gbps)。Ranking 模型还在迁移到 GPU 的早期阶段,但使用 GPU 的规模也在不断...
-
使用FastChat快速部署LLM服务
原文:https://zhuanlan.zhihu.com/p/705915093 FastChat 是一个用于训练、服务和评估基于LLM的聊天机器人的开放平台,它的核心功能包括: 最先进模型(例如 Vicuna、MT-Bench)的训练和评估代码。...
-
小琳AI课堂:Llama——NLP界的多面手
? Llama: NLP界的多面手 ? 引言: 大家好,这里是小琳AI课堂。今天,我们要探索的是自然语言处理(NLP)领域的一位明星——Llama。? Llama,由Meta AI(原Facebook AI)开发,以其轻量级、高效和易用性著称,是处...
-
大厂围堵AI创业曝「死亡名单」,前谷歌大佬出走几乎无一幸免!
前谷歌员工出走创立的AI初创公司,一个个都被大科技公司收购了!硅谷吹的这是什么邪风?外媒总结了一波谷歌AI研究人员创业难的原因,更是「扎心」地给出了一个预言名单,一一点名了眼瞅着就要被大公司收购的企业。 万众瞩目的AI初创明星公司,才四个月就风光不再了...
-
springboot笔记
目录 一springboot 1.什么是springboot 2.springboot开发步骤 3.springboot优点 4.springboot的依赖管理 目录 springboot 1.什么是springboot 2.spri...
-
ChatGLM-6B入门
ChatGLM-6B ChatGLM-6B 一、介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡...
-
AI日报:可图上线一键换衣软件;Grok-2挤进聊天机器人第二名;大学生靠Claude 3.5成功造出核聚变反应堆
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、可图上线一键换衣Kolors...
-
Datawhale X 魔搭 AI夏令营 第四期 AIGC task3
part 1:认识comfyUI 1.初识ComfyUI 1.1什么是Comfy UI GUI是"Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。...
-
SD创始团队黑马的Flux真的那强吗?SD Flux与华为ultrapixel大PK!群雄逐鹿!“百模”并起,王者之战~!
前言 小南还是没忍住,看大家都在试玩Flux,真的有那么震撼么?小南手痒痒也体验下吧。今天主要简单介绍下Flux以及ComfyUI的安装,重点是和我们“遥遥领先”的华为开源的ultrapixel进行下对比。没有对比就没有伤害! 大家应该对Flux也有...
-
在亚马逊云科技上对Stable Diffusion模型提示词、输出图像内容进行安全审核
项目简介: 小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案,帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践,并应用到自己的日常工作里。 本次介绍的是如何在亚马逊云科技机器学习托管服务Sage...
-
推荐使用:openai-whisper-talk —— 您的个人声音助手
推荐使用:openai-whisper-talk —— 您的个人声音助手 openai-whisper-talkopenai-whisper-talk is a sample voice conversation application powered...
-
Transformer作者预警:只卖模型玩不过OpenAI!
Transformer八子中最年轻的Aidan Gomez在最新的采访中感叹: 谷歌版的Aidan Gomez,是给AI领域带来深远影响的Transformer作者之一。 而现在的Aidan Gomez,是估值飙升55亿美元的Cohere公司的联合创始人...
-
Llama 3.1中文微调数据集已上线,超大模型一键部署
7 月的 AI 圈真是卷完小模型卷大模型,精彩不停!大多数同学都能体验 GPT-4o、Mistral-Nemo 这样的小模型,但 Llama-3.1-405B 和 Mistral-Large-2 这样的超大模型让很多小伙伴犯了难。 别担心!hyper.a...
-
部署本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2
本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2 所有教程都免费开源,请动动小手点个小星星https://github.com/Seeed-Projects/jetson-examples...
-
超越SD3,比肩MJ v6,文生图模型FLUX.1开源
近日,图片生成模型FLUX.1引爆了AIGC社区,其在视觉质量、图像细节和输出多样性等方面性能优越,输出极佳的图片生成效果。 FLUX.1系列模型由Black Forest Labs开源,创始人Robin Rombach是Stable Diffu...
-
【LLM】一、利用ollama本地部署大模型
目录 前言 一、Ollama 简介 1、什么是Ollama 2、特点: 二、Windows部署 1.下载 2.安装 3.测试安装 4.模型部署: 5.注意 三、 Docker部署 1.do...
-
AI应用商店是门好生意,可要如何说服开发者入驻?
无论Epic Games、Spotify这种一直与苹果对簿公堂,还是腾讯、抖音这样试图钻相关规则漏洞的公司,对于苹果通过应用内购买(IAP)抽取30%的费用,越来越多的头部开发者开始失去耐心。但就在抱怨“苹果税”的同时,有能力的厂商也在尝试复刻苹果建立的这...
-
WhisperX 安装与使用指南
WhisperX 安装与使用指南 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音识别和语音...