git 第6页 - AIGC资讯

本地搭建 Whisper 语音识别模型实现实时语音识别研究

目录摘要关键词 1. 引言 2. Whisper 模型简介 3. 环境准备 4. 系统架构与实现 4.1 模型加载 4.2 实时音频输入处理 4.3 实时转录处理 4.4 程序实现的框架 4.5 代码实现 5. 实验与结果 6...

生成式AI 2024-09-15 人工智能

1578阅读

audioWhisper 项目使用教程

audioWhisper 项目使用教程 audioWhisperListen to any audio stream on your machine and print out the transcribed or translated audio.项...

大数据 2024-09-15 人工智能

890阅读

Ollama保姆级教程

Ollama保姆级教程 Ollama是一个开源框架，专门设计用于在本地运行大型语言模型。它的主要特点是将模型权重、配置和数据捆绑到一个包中，从而优化了设置和配置细节，包括GPU使用情况，简化了在本地运行大型模型的过程。 Ollama还提供了对模型量化...

生成式AI 2024-09-15 人工智能

5145阅读

Midjourney自动化机器人使用教程

Midjourney自动化机器人使用教程 midjourney-automation-botThis repository hosts the Midjourney Automation Bot, a free script leveraging Op...

大数据 2024-09-15 人工智能

1170阅读

使用Amazon SageMaker JumpStart微调Meta Llama 3.1模型以进行生成式AI推理

文章目录使用Amazon SageMaker JumpStart微调Meta Llama 3.1模型以进行生成式AI推理 Meta Llama 3.1 SageMaker JumpStart SageMaker JumpStart中Meta...

大数据 2024-09-15 人工智能

1090阅读

Jetson 部署 Faster Whisper

文章目录 Whisper Faster Whisper 安装使用尝试WSL部署尝试 Jetson 部署时间戳实时转录 Whisper Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一...

大数据 2024-09-15 人工智能

2560阅读

StableDiffusion（SD）文生图教程

参数详解 ?提示词词输入（Prompt） SD中的关键词分为正面提示词和负面提示词。正面提示词（Prompt）将想要的图像进行描述，描述的越详细，越能达到你想要的效果；描述的越少，越由AI随意发挥，更加有创意性。负面提示词（Negative Pro...

生成式AI 2024-09-15 人工智能

1846阅读

探索Meta新发布的大模型：Llama 3.1

最近正好关注到了meta发布的新大模型llama3.1，于是抱着好奇的态度来试一下。近期，Meta发布了其最新的大模型——Llama 3.1。作为一名科技爱好者和人工智能的追随者，我迫不及待地想要了解这一新模型的性能和特点。本文将带你一起探索Llama...

AIGC 2024-09-15 人工智能

1198阅读

stable diffusion的AnimateDiff动画插件

AnimateDiff简介 Stable Diffusion的AnimateDiff插件是一个用于生成和操作图像的强大工具，它属于Stable Diffusion模型的一个扩展。 1. 功能和用途图像生成与修改: AnimateDiff插件能够...

人工智能 2024-09-15 人工智能

1793阅读

免费体验！快速生成超逼真真人美图的Stable Diffusion模型!

环境安装 1、安装Python 下载地址：https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe。备注：把安装目录加入环境变量！ 2、安装git 下载地址：h...

人工智能 2024-09-15 人工智能

1226阅读

Whisper Web 开源项目教程

Whisper Web 开源项目教程 whisper-webML-powered speech recognition directly in your browser项目地址:https://gitcode.com/gh_mirrors/wh/whi...

生成式AI 2024-09-15 人工智能

1413阅读

使用WhisperLive实现实时语音转文本的魅力

使用WhisperLive实现实时语音转文本的魅力 WhisperLiveA nearly-live implementation of OpenAI's Whisper.项目地址:https://gitcode.com/gh_mirrors/wh/W...

AIGC 2024-09-15 人工智能

1899阅读

AIGC实践——asr识别FunASR手把手部署流程

? 大家好，我是可夫小子，《小白玩转ChatGPT》专栏作者，关注AIGC、互联网和自媒体。 FunASR是什么？ FunASR 是一个基本的语音识别工具包，提供多种功能，包括语音识别 (ASR 、语音活动检测 (VAD 、标点符号恢复、语言模型...

AIGC 2024-09-15 人工智能

4355阅读

推荐项目：Config-Presets - 让Stable Diffusion Web UI的创造力倍增！

推荐项目：Config-Presets - 让Stable Diffusion Web UI的创造力倍增！ Config-PresetsExtension for Automatic1111项目地址:https://gitcode.com/gh_mir...

大数据 2024-09-15 人工智能

1098阅读

Cog-Stable-Diffusion 开源项目指南

Cog-Stable-Diffusion 开源项目指南 cog-stable-diffusionDiffusers Stable Diffusion as a Cog model项目地址:https://gitcode.com/gh_mirrors/c...

生成式AI 2024-09-14 人工智能

1115阅读

AI绘画SD中，如何保持生成人物角色脸部一致？Stable Diffusion精准控制AI人像一致性两种实用方法教程！

大家好，程序员晓晓在AI绘画StableDiffusion中，一直都有一个比较困难的问题，就是如何保证每次出图都是同一个人。今天就这个问题分享一些个人实践，大家和我一起来看看吧。一. 有哪些实现方式方式1：固定Seed种子值。固定Seed种...

生成式AI 2024-09-14 人工智能

2594阅读

开源项目教程：Llama

开源项目教程：Llama llama项目地址:https://gitcode.com/gh_mirrors/llam/llama 项目介绍此教程基于GitHub上的开源项目 nelhage/llama，不过请注意，上述提供的链接并非真实的项目地...

大数据 2024-09-14 人工智能

955阅读

GitHub Copilot使用

本文会用更通俗的语言，并提供更全面的用例和具体操作步骤，帮助你更好地使用 Copilot 进行代码编写和优化。 **GitHub Copilot ** GitHub Copilot 是一款强大的 AI 辅助编程工具，通过编写提示词（Prompt）可以...

人工智能 2024-09-14 人工智能

1370阅读

大模型_基于医疗领域用lora微调医疗数据及LLaMA微调ChatDoctor模型

文章目录 ChatDoctor 目标方法结果结论收集和准备医患对话数据集创建外部知识数据库具有知识大脑的自主聊天医生的开发模型培训结果数据和模型：微调推理 ChatDoctor 目标这项研究的主要...

AIGC 2024-09-14 人工智能

1648阅读

Copilot新版界面体验教程（20240607）

一、Copilot简介微软 Copilot 是一款由微软推出的日常 AI 助手，它整合了微软多个产品中的 AI 功能，如 GitHub、Microsoft 365、Bing 和 Edge，提供一个统一的体验。Copilot 能够根据网络上的上下文、工作...

生成式AI 2024-09-14 人工智能

1322阅读

探索未来编程：掌握GitHub Copilot的奥秘

探索未来编程：掌握GitHub Copilot的奥秘 Mastering-GitHub-Copilot-for-Paired-ProgrammingA 6 Lesson course teaching everything you need to kn...

人工智能 2024-09-14 人工智能

1074阅读

DatawhaleX魔搭-AI夏令营AIGC-task2

一、了解AI生图技术 1，为什么了解生图技术 AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式，很早就有专家指出，AIGC将是未来人工智能的重点方向，也将改造相关行业和领域生产内容的方式。应用广泛...

人工智能 2024-09-14 人工智能

1030阅读

【AI绘画】ComfyUI Flux：你必须要掌握的Flux Controlnet，商业闭环就靠它了

大家好，我是爱绘画的彤姐。目前Flux开始支持Controlent了，这个一定要掌握，今天就来带大家学习Flux中Controlnet的使用。一、介绍今天继续来分享Flux生态里面一个很重要插件，就是Controlnet，我们都知道Contr...

人工智能 2024-09-14 人工智能

3156阅读

GoAmzAI-全新的AIGC应用、AI系统程序，授权私有化部署 - 基于 Golang + Vue 的全新的个人、团队、企业私有化、运营的AIGC系统应用功能介绍

功能概览极速部署，宝塔5分钟部署完成，低内存高并发，内存占用不到100MB！配置简单快捷，配置文件仅需数据库配置即可启动强大的在线配置框架及丝滑版的体验，95%数据都可以后台在线统一管理！完美的自适应，支持手机、平板、电脑等多种尺寸设备的浏览...

大数据 2024-09-14 人工智能

1666阅读

llamafactory-llama3微调中文数据集

一、定义 https://github.com/SmartFlowAI/Llama3-Tutorial/tree/main 基准模型测试 opencompass 离线测评数据准备微调训练合并测试人工审核对比二、实现基准模型测试...

人工智能 2024-09-14 人工智能

929阅读

探索和构建 LLaMA 3 架构：深入探究组件、编码和推理技术

Meta 正在加大在人工智能 (AI 竞赛中的力度，推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持，现已在所有 Meta 平台上可用。以下是您需要了解的有关 Meta 最新大型语言模...

大数据 2024-09-14 人工智能

1291阅读

在Ubuntu22.04 使用stable-diffusion-webui 秋叶整合包

背景众所周知，赛博菩萨已经发布了windows下的整合包，开箱即用，且集成度较高。那我为啥非要在Ubuntu下使用呢？当然是因为主力机就是Ubuntu系统啦。而且涉及到sd webui API 的调用，在Ubuntu 下调试更加方便一点。那有...

人工智能 2024-09-13 人工智能

1915阅读

如何系统学习AIGC（人工智能生成内容）：适合普通人的入门指南

随着人工智能技术的迅猛发展，AIGC（人工智能生成内容）已成为一大热点。对于非软件技术专业的普通人来说，如何系统地学习AIGC，了解底层知识结构、掌握常见工具用法，是一个非常实际的问题。本文将为大家推荐一些优质的中文学习资料和方法，帮助大家更好地入门AIG...

生成式AI 2024-09-13 人工智能

2777阅读

集成 Sermant，ServiceStage 带你实现应用上下线平滑过渡

摘要：为了保证应用正确上下线、流量不丢失，ServiceStage 基于 Sermant 提供了一套优雅上下线的方案，包括预热、延迟下线等，避免了请求超时、连接拒绝、流量丢失等问题的发生。本文分享自华为云社区《ServiceStage 集成 Ser...

大数据 2024-09-13 人工智能

954阅读

9、LLaMA-Factory项目微调介绍

1、LLaMA Factory 介绍 LLaMA Factory是一个在GitHub上开源的项目，该项目给自身的定位是：提供一个易于使用的大语言模型（LLM）微调框架，支持LLaMA、Baichuan、Qwen、ChatGLM等架构的大模型。更细致...

生成式AI 2024-09-13 人工智能

1862阅读

Faster Whisper 使用教程

Faster Whisper 使用教程 faster-whisper项目地址:https://gitcode.com/gh_mirrors/fas/faster-whisper 项目介绍 Faster Whisper 是一个基于 CTransla...

大数据 2024-09-13 人工智能

2353阅读

OpenAI Whisper 开源项目使用手册

OpenAI Whisper 开源项目使用手册 openai-whisperA sample web app using OpenAI Whisper to transcribe audio built on Next.js. It records a...

人工智能 2024-09-13 人工智能

1091阅读

Whisper-Dictation：基于OpenAI语音转文本模型的开源录音转文字应用

Whisper-Dictation：基于OpenAI语音转文本模型的开源录音转文字应用 whisper_dictation Fast! Offline, privacy-focused, hands-free voice typing, 2-way...

AIGC 2024-09-13 人工智能

1399阅读

探索语言的极限：高效运行LLaMA模型的开源宝藏 —— llama_infer

探索语言的极限：高效运行LLaMA模型的开源宝藏 —— llama_infer llama_inferInference script for Meta's LLaMA models using Hugging Face wrapper项目地址:htt...

AIGC 2024-09-13 人工智能

1091阅读

本地服务器部署Text generation并添加code llama实现远程多人协作

文章目录前言 1. 本地部署Text generation Web UI 2. 安装CodeLlama大模型 3. 实现公网远程使用Code Llama 4. 固定Text generation Web UI公网地址前言本篇...

人工智能 2024-09-13 人工智能

1233阅读

清华系公司强强联合，一张4090让安全大模型进入千亿时代｜长亭x趋境

AI大行其道的时代，网络安全正面临前所未有的威胁。化身黑客的AI学会了自动化攻击，还有相当高的成功率，伊利诺伊大学香槟分校研究团队的最新研究显示:GPT-4能够在阅读CVE漏洞描述后，学会利用漏洞攻击，成功率高达87%。既然攻击方都与时俱进，用上AI新...

人工智能 2024-09-13 人工智能

921阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 task03笔记

在task02中，我们对baseline有了深度了解，我们学会了用AI工具来帮助我们学习。另外，我们制作了话剧连环画。我们今天的任务是了解微调的基本原理，然后我们会对微调的各种参数有一个更加清楚的了解，来实现一个更好的效果，并且在这个Task中会给大家...

AIGC 2024-09-13 人工智能

995阅读

无需训练的 Diffusion MoE 方案 (SegMoE): Segmind Mixture of Diffusion Experts

Paper name SegMoE: Segmind Mixture of Diffusion Experts Paper Reading Note Blog URL: https://blog.segmind.com/introducing-seg...

生成式AI 2024-09-13 人工智能

1349阅读

5分钟 Stable Diffusion本地安装

要在5分钟内完成Stable Diffusion的本地安装，可以参考以下步骤：下载安装包：首先，需要下载Stable Diffusion的一键部署包。可以从多个资源网站或教程中找到下载链接，例如秋叶整合包。解压安装包：下载完成后，解压安装包。...

大数据 2024-09-13 人工智能

1488阅读

【AIGC半月报】AIGC大模型启元：2024.08（下）

【AIGC半月报】AIGC大模型启元：2024.08（下）） (1 Nemotron-4-Minitron（Nvidia LLM） (2 VITA（腾讯优图多模态大模型） (3 mPLUG-Owl3（阿里巴巴多模态大模型） (4 ADA...

AIGC 2024-09-13 人工智能

1123阅读

llama-node 项目教程

llama-node 项目教程 llama-nodeBelieve in AI democratization. llama for nodejs backed by llama-rs, llama.cpp and rwkv.cpp, work loc...

生成式AI 2024-09-12 人工智能

918阅读

推荐项目：Honest LLaMA——追求真相的大型语言模型干预技术

推荐项目：Honest LLaMA——追求真相的大型语言模型干预技术 honest_llamaInference-Time Intervention: Eliciting Truthful Answers from a Language Model项目...

大数据 2024-09-12 人工智能

1412阅读

Flux【基础篇】：Flux&Midjourney&SDXL模型出图对比：细节质量

大家好我是极客菌！！！前面和大家分享了Flux在手部和脚生成图片的效果。今天我们看一下Flux在细节质量上面的表现。主要是以下3个模型的对比。 Flux.1 Dev Midjourney V6.1 SD大模型：RealVisXL V4...

人工智能 2024-09-12 人工智能

2731阅读

本地部署Llama 3.1大模型

Meta推出的Llama 3.1系列包括80亿、700亿、4050亿参数版本，上下文长度扩展至12.8万tokens，并增加了对八种语言的支持。部署模型需要用到Ollama的一个工具，访问官方网站https://ollama.com 点击下载...

生成式AI 2024-09-12 人工智能

1302阅读

24最新Stable Diffusion 本地部署，超详细教程（手动+自动+整合包三种方式）总有一种适合你！

前言一、 Stable Diffusion简介 2022年作为AIGC（Artificial Intelligence Generated Content）时代的元年，各个领域的AIGC技术都有一个迅猛的发展，给工业界、学术界、投资界甚至...

生成式AI 2024-09-12 人工智能

1560阅读

Unsloth微调环境搭建与LLaMA 3.1-8B模型微调实践指南

本文将详细介绍如何使用Unsloth框架进行LLaMA 3.1-8B模型的微调，帮助您快速构建微调环境，并了解微调流程的基本步骤。本教程适合初学者，旨在帮助您在短时间内实现自己的专属模型微调。对于更复杂的微调参数和细节设置，将在后续文章中进一步阐述。文...

AIGC 2024-09-12 人工智能

2249阅读

AIGC文生图 ComfyUI介绍与实践+Lora微调-Task3 Datawhale X 魔搭 AI夏令营第四期

目录概要 ComfyUI介绍 ComfyUI实践 ComfyUI学习资源推荐 Lora微调 Lora数据库推荐问题解决说在最后概要今天的任务是了解微调的基本原理，然后会对微调的各种参数有一个更加清楚的阐释，来实现...

人工智能 2024-09-12 人工智能

1564阅读

AuraFlow：超越Stable Diffusion 3，开源文生图模型的未来之星

前沿科技速递? 开源创新先锋fal.ai携手社区顶尖开发者，震撼发布AuraFlow v0.1——全球首个完全开源的大型整流流文本到图像生成模型，开启文生图领域新篇章！极致开源精神：AuraFlow v0.1作为对Stable Diffusion...

生成式AI 2024-09-12 人工智能

1363阅读

Stable Diffusion Discord Bot 项目教程

Stable Diffusion Discord Bot 项目教程 stable-diffusion-discord-botA Discord bot, written in Go, that interfaces with the Automatic...

大数据 2024-09-12 人工智能

897阅读

llama.cpp本地部署大模型

llama.cpp 是一个C++库，用于简化LLM推理的设置，它使得在本地机器上运行大模型（GGUF格式）成为可能。官网：https://github.com/ggerganov/llama.cpp 模型库： https://huggingface...

AIGC 2024-09-12 人工智能

2813阅读