-
【Stable diffusion】绘世启动器绘画有多简单?
文章目录 目录 文章目录 概要 整体架构流程 一、插件与模型集成 二、对新手友好 三、绘画高手如虎添翼 技术细节 小结 概要 随着秋叶大神的绘世启动器4.8版本发布,AI绘画的搭建过程越来越...
-
Prompt-hunter:一键保存Midjourney细节页面至Notion的高效工具
Prompt-hunter:一键保存Midjourney细节页面至Notion的高效工具 Prompt-hunterSave the Prompt and images from the Midjourney details page to your...
-
107 深入解析Llama Index的响应合成器 llamaindex.core.response_synthesizers.facotry.py
深入解析Llama Index的响应合成器 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的一个关键组件——响应合成器(Response Synthesi...
-
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低 50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。 在腾讯...
-
12款最常使用的网络爬虫工具推荐
网络爬虫在当今的许多领域得到广泛应用。它的作用是从任何网站获取特定的或更新的数据并存储下来。网络爬虫工具越来越为人所熟知,因为网络爬虫简化并自动化了整个爬取过程,使每个人都可以轻松访问网站数据资源。使用网络爬虫工具可以让人们免于重复打字或复制粘贴,我们可以...
-
WhisperX: 带时间戳的自动语音识别及说话人分离
WhisperX: 带时间戳的自动语音识别及说话人分离 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,...
-
LongLLaMA:扩展上下文处理能力的大型语言模型
LongLLaMA:扩展上下文处理能力的大型语言模型 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on Ope...
-
如何在家用设备上运行 Llama 3.1 405B?搭建 AI 集群
在开放式 LLM 模型和封闭式 LLM 模型之间的竞争中,开放式模型的最大优势是您可以在本地运行它们。除了电力和硬件成本外,您无需依赖外部提供商或支付任何额外费用。但是,随着模型大小的增加,这种优势开始减弱。运行需要大量内存的大型模型并不容易。幸运的是,张...
-
重磅!Stable Diffusion创始团队推出FLUX.1:一夜颠覆MJ v6,DALL·E 3,SD3!
前言 Stable Diffusion 大家已经很熟悉了,是由 CompVis 团队开发的,这是一个隶属于德国慕尼黑大学的计算机视觉研究小组。该团队由多个研究人员和开发者组成,包括 Patrick Esser、Robin Rombach 和 Bjö...
-
《Llama 3大模型》技术报告中英文版,95页pdf
现代人工智能(AI)系统由基础模型驱动。本文介绍了一套新的基础模型,称为Llama 3。它是一群本地支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个具有4050亿参数和高达128K令牌上下文窗口的密集Transformer。本文对Llama...
-
如何申请 Midjourney API ,看这篇文章就够了
如何申请 Midjourney API ,看这篇文章就够了 Midjourney 是一款非常强大的 AI 绘图工具,只要输入关键字,就能在短短一两分钟生成十分精美的图像。Midjourney 以其出色的绘图能力在业界独树一帜,如今,Midjourney...
-
爆了,Llama 3.5 405B 爆超GPT-4o,参数直接飙到405B,开源终于战胜了闭源大模型GPT-4o
赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代 就在刚刚,Meta 如期发布了 Llama 3.1 模型。 简单来说,最新发布的 Llama 3.1 405B 是 Meta 迄今为止最强大的模型,也...
-
利用Streamlit前端框架开发Stable Diffusion模型图像生成网页应用(下篇)
今天介绍亚马逊云科技推出的国际前沿人工智能模型平台Amazon Bedrock上的Stability Diffusion模型开发生成式AI图像生成应用!本系列共有3篇,在上篇中我们学习了如何在亚马逊云科技控制台上体验该模型的每个特色功能,如文生图、图生图、...
-
WhisperX:革命性的自动语音识别工具
WhisperX:革命性的自动语音识别工具 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音...
-
【技术前沿】Flux.1部署教程入门--Stable Diffusion团队最前沿、免费的开源AI图像生成器
项目简介 FLUX.1 是一种新的开源图像生成模型。它由 Stable Diffusion 背后的团队 Black Forest Labs 开发。 官网中有以下功能开源供大家参考: FLUX.1 擅长在图像中准确再现文字,因此非常适合需要清晰文字或...
-
RAG 入门指南:从零开始构建一个 RAG 系统
本文正文字数约 3300 字,阅读时间 10 分钟。 从零开始构建一个应用可以让我们快速理解应用的各个部分。 这个方法其实非常适用于 RAG。 我在以前的文章中有介绍过 RAG 的概念、原理以及应用等,但其实,亲自动手来构建一个 RAG 系统或许能够...
-
Llama 3.1 405B:4050亿参数史上最强开源大模型
01 。 概述 Meta公司推出了其最大的开源人工智能模型——Llama 3.1 405B,拥有4050亿个参数,与GPT-4o和Claude 3.5 Sonnet相媲美。该模型在16000个Nvidia H100 GPU上训练而成,现已在云平台上可用,...
-
K8sGPT 搭配 LLaMA 3.1:8B,AI 运维也能轻松搞定
文章目录 1. 前言 2. 安装工具 3. 运行 k8s 集群 4. 运行本地 llama 模型 5. k8sgpt 模型认证管理 5.1 添加 openAI 模型认证 5.2 添加本地 llama3.1:8b模型认证 5.3 删除模型认证...
-
Stable diffusion: AttributeError: module ‘jax.random‘ has no attribute ‘KeyArray‘
错误提示 安装from diffusers import StableDiffusionPipeline 提示错误 AttributeError: module ‘jax.random’ has no attribute ‘KeyArray’...
-
《史上最简单的SpringAI+Llama3.x教程》-05-打破界限,Function Calling在业务场景中的应用
什么是Function Calling Function Calling 是一种技术,它允许大型语言模型(如GPT)在生成文本的过程中调用外部函数或服务。 这种功能的核心在于,模型本身不直接执行函数,而是生成包含函数名称和执行函数所需参数的JSON,...
-
使用 Ollama、Llama 3.1 和 Milvus 进行函数调用案例
偶然看到一篇很短代码就能实现llama function call的文章。 秉着学习加分项的原则,进行了实验测试。这里给出案例和全部改写后的代码。 将 LLM 与函数调用相结合,就如同赋予您的 AI 连接世界的能力。通过将您的 LLM 与外部工具(例如用...
-
无需本地部署!免费使用开源大模型API
之前,我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说,给本地大模型添加知识库、API的调用等等。 在这个过程中,有粉丝反馈自己不会部署,或者电脑配置不好,想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种...
-
8G显存运行Llama 3.1 405B!
我正在接受挑战,在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB!这是 8GB VRAM 容量的 103 倍! 显然,8GB VRAM 无法容纳它。那么我们如何让它工作呢?...
-
如何本地搭建Whisper语音识别模型
如何本地搭建Whisper语音识别模型 如何本地搭建Whisper语音识别模型 1. 引言 Whisper模型简介 本地搭建的意义和应用场景 应用场景包括但不限于: 2. 环境准备 系统要求 Python环境安装 依赖库安装 3. 安...
-
探索音频转文字的高效之道:whisper-rs项目解析与应用
探索音频转文字的高效之道:whisper-rs项目解析与应用 whisper-rsRust bindings to https://github.com/ggerganov/whisper.cpp项目地址:https://gitcode.com/gh_...
-
在线体验阿里云的通义万相(AIGC)文本绘图与人像美化功能
介绍 阿里云的通义万相AIGC技术为Web服务带来了图像生成的全新境界。想象一下,仅凭一段文字描述或随手涂鸦,就能转换为专业级的图像作品,包括人像风格重塑和定制写真等。这不仅加速了创意流程,也为广告、教育、游戏等行业带来视觉升级,满足个性化视觉内容需求...
-
抖音豆包大模型AI写作教程
简数采集器支持调用字节跳动抖音的豆包AI大模型API接口,用于对采集的数据进行研究分析,内容写作等。 抖音豆包大模型AI写作使用教程: 目录 1.启用豆包AI大模型API功能 2.设置豆包API处理规则 3.应用API规则处理数据 4.获取AI...
-
ToB Or ToC,大模型不做“选择题”
在AI大模型的商业化道路上,“ToB or ToC”一直是两难的选择。不过,AI业内有一个共识,创业公司在C端更容易找到机会,而互联网大厂则更能通过B端获得规模优势。 但目前来看,这一共识可能要被打破了。一直被认为是“To C主义者”的月之暗面,近日官宣将...
-
阿里重磅开源Qwen2-VL:能理解超20分钟视频,媲美GPT-4o!
阿里巴巴开源了最新视觉多模态模型Qwen2-VL,根据测试数据显示,其72B模型在大部分指标超过了OpenAI的GPT-4o,Anthropic的Claude3.5-Sonnet等著名闭源模型,成为目前最强多模态模型之一。 Qwen2-VL支持中文、英文、...
-
生成式AI,搜索赛道的又一个黄金十年
随着生成式AI的发展,搜索引擎正在被重构,越来越多玩家开始布局AI搜索赛道。 一方面,传统搜索引擎/浏览器正借助AI技术的重构重新焕发生机,无论是移动端还是PC端,都在抢占更多的搜索流量。 比如7月,阿里旗下夸克升级“超级搜索框”,推出以AI搜索为中心的一...
-
智谱AI静悄悄的上线了一大波新模型,过年了,真的。
智谱29日下午在KDD2024上面,悄咪咪的上线了一堆的超级更新。 我真的服了,我本来今天从泰国回来,准备休一天假的,结果晚上又坐在电脑面前被迫营业。 他们总是每次,静悄悄的就把4个2给扔出去了。 嗯,就一场演讲了,发布了一堆新模型还有新功能,个顶个都很...
-
开源项目:Stable Diffusion Prompt Reader 教程
开源项目:Stable Diffusion Prompt Reader 教程 stable-diffusion-prompt-readerstable-diffusion-prompt-reader - 一个简单的独立查看器,用于在Web UI外部读取...
-
llama.cpp使用
llama.cpp的github库地址为ggerganov/llama.cpp: LLM inference in C/C++ (github.com ,具体使用以官方说明为准。 简介 llama.cpp目标是在本地和云端的各种硬件上以最小的设置和最...
-
超越传统续写模式:AI 编程距离智能研发终态还有多远?
在软件开发领域,大模型驱动的智能代码生成技术已成为研究热点,引起了广泛关注和探索。在7月27日,由开源中国主办的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动,来自百度工程效能部的前端研发经理杨经纬,从一款 AI 编程助手 —— 文心快...
-
Whisper-TikTok 使用指南
Whisper-TikTok 使用指南 Whisper-TikTokFrom AI tools to TikTok video creation using FFMPEG, Microsoft Edge read aloud and OpenAI Wh...
-
Q-Copilot,基于Java+NapCatQQ+LLM+Tools构建的全新QQ AI机器人,打造私人助理,支持邮件发送,超级详细!!!
Q-Copilot简介 传统的QQ机器人可以说几乎对自然语言没有理解能力,只能通过固定指令的方式进行特定任务是执行。比如查询天气,你只能说"天气 深圳","01 深圳",等类似固定指令,不管是从开发角度还是用户角度都极其机械化。...
-
讯飞大模型,还在投入期
今年,国内大模型进入到了商业化提速的新阶段。纯粹讲技术的公司越来越少,取而代之的是落地。为了寻找相对确定性的变现模式,许多玩家仍延续互联网时代的经验,按图索骥般地在B端和C端摸索新技术与经营的边界。 在这其中,科大讯飞尤为特殊,其身上不仅充斥着跨越两个AI...
-
开源智能助手平台Dify是什么?
1.背景 对于国内小公司,怎样通过Ai 将内部流程、产品重新做一次,从而提高人效、给客户带来价值,这是老板们在考虑的问题 ? 当前市面上的你大模型例如:通义千问、文心一言、kimi、智谱清言、盘古 等,底层能力都非常强大(千亿级参数),但各个模型使用有...
-
百度文心一言API调用,千帆大模型获取API Key和API Secret图解
百度文心一言大模型调用教程,获取文心一言API Key和API Secret的方法,码笔记mabiji.com告诉大家在百度智能云的千帆大模型平台创建应用,即可获取文心一言的API Key和API Secret,详细流程如下: 1、在百度智能云的千帆大模...
-
使用gradio部署微调后的模型
文章目录 概要 整体架构流程 技术细节 小结 概要 使用gradio部署微调后的模型 整体架构流程 gradio前期学习,以下是一些常见的输入输出组件,有些即可输入也可输出 gr.Audio(sources=['mi...
-
在LangChain中使用Llama.cpp:从安装到实践
在LangChain中使用Llama.cpp:从安装到实践 引言 Llama.cpp是一个高效的C++库,用于在CPU上运行大型语言模型(LLMs)。本文将介绍如何在LangChain中集成和使用Llama.cpp,包括安装、设置以及使用LLM和嵌...
-
Whisper-Streaming:实时语音转写与翻译的革命性工具
Whisper-Streaming:实时语音转写与翻译的革命性工具 whisper_streamingWhisper realtime streaming for long speech-to-text transcription and transl...
-
Bili.Copilot 开源项目教程
Bili.Copilot 开源项目教程 Bili.Copilot哔哩哔哩用户的个人助理项目地址:https://gitcode.com/gh_mirrors/bi/Bili.Copilot 项目介绍 Bili.Copilot 是一个基于开源技术构...
-
大模型框架汇总:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel
常见的大模型框架:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel: 大模型框架是指用于训练、推理和部署大型语言模型(LLMs)的软件工具和...
-
4060显卡+LLaMA-Factory微调LLM环境准备——(一)安装cuda
本地配置 系统:win10**硬件:**i5-12490f+RTX4060 安装原因: 最近尝试在本地对开源LLM进行Fine-tune的时候,用到了LLaMA-Factory,在运行的时候,弹出未检测到GPU,后来才发现,是忘记安装cuda等...
-
探索GitHub Copilot的深度洞见:Copilot Metrics Viewer全面解析
探索GitHub Copilot的深度洞见:Copilot Metrics Viewer全面解析 copilot-metrics-viewerTool to visualize the Copilot metrics provided via the...
-
LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设
模型越来越大,需要的 GPU 越来越多;与此同时 GPU 性能也在不断增强,配套的网络带宽也不断增加到 400G(Blackwell GPU 甚至需要到 800 Gbps)。Ranking 模型还在迁移到 GPU 的早期阶段,但使用 GPU 的规模也在不断...
-
使用FastChat快速部署LLM服务
原文:https://zhuanlan.zhihu.com/p/705915093 FastChat 是一个用于训练、服务和评估基于LLM的聊天机器人的开放平台,它的核心功能包括: 最先进模型(例如 Vicuna、MT-Bench)的训练和评估代码。...
-
小琳AI课堂:Llama——NLP界的多面手
? Llama: NLP界的多面手 ? 引言: 大家好,这里是小琳AI课堂。今天,我们要探索的是自然语言处理(NLP)领域的一位明星——Llama。? Llama,由Meta AI(原Facebook AI)开发,以其轻量级、高效和易用性著称,是处...
-
大厂围堵AI创业曝「死亡名单」,前谷歌大佬出走几乎无一幸免!
前谷歌员工出走创立的AI初创公司,一个个都被大科技公司收购了!硅谷吹的这是什么邪风?外媒总结了一波谷歌AI研究人员创业难的原因,更是「扎心」地给出了一个预言名单,一一点名了眼瞅着就要被大公司收购的企业。 万众瞩目的AI初创明星公司,才四个月就风光不再了...