-
Dreambooth-Stable-Diffusion 使用教程
Dreambooth-Stable-Diffusion 使用教程 Dreambooth-Stable-DiffusionImplementation of Dreambooth (https://arxiv.org/abs/2208.12242 by...
-
Llama-2-Open-Source-LLM-CPU-Inference 使用教程
Llama-2-Open-Source-LLM-CPU-Inference 使用教程 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on...
-
阿里开源语音大模型CosyVoice:3秒还原声音,从部署到克隆的完整指南
前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。 我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义实验室在七...
-
使用Faster Whisper:提升你的音频处理效率和质量
使用Faster Whisper:提升你的音频处理效率和质量 faster-whisper项目地址:https://gitcode.com/gh_mirrors/fas/faster-whisper 该项目,,是一个开源的Python库,专为优化对...
-
Whisper Burn 开源项目教程
Whisper Burn 开源项目教程 whisper-burnA Rust implementation of OpenAI's Whisper model using the burn framework项目地址:https://gitcode.c...
-
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...
-
【2024W30】肖恩技术周刊(第 8 期):奥运会热度不高?
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“工具分享”等。为减少阅读负担提高记忆留存率,每类下内容数一般不超过3条。更新时间: 星期天历史收录: shawn-weekly订阅方式:...
-
Feishu-Midjourney 开源项目实战指南
Feishu-Midjourney 开源项目实战指南 Feishu-Midjourney? 飞书 x midjourney = 你真正的创意伙伴项目地址:https://gitcode.com/gh_mirrors/fe/Feishu-Midjourn...
-
AIGC浪潮中的程序员:日常编码与自我提升的平衡术
随着人工智能技术的飞速进步,AIGC(人工智能生成内容)技术在软件开发领域的应用日益广泛,它不仅改变了编码工作的方式,更对我们的职业发展路径和技能结构提出了新的要求。在这样一个快速变化的环境中,如何深度平衡日常编码工作与提升式学习,成为了一个亟待解决的重要...
-
推荐开源项目:Anthony's QR Toolkit for Stable Diffusion WebUI
推荐开源项目:Anthony's QR Toolkit for Stable Diffusion WebUI sd-webui-qrcode-toolkitAnthony's QR Toolkit for Stable Diffusion WebUI项...
-
运行Llama 2于本地CPU上的开源LLM推理指南
运行Llama 2于本地CPU上的开源LLM推理指南 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on CPU Inference Lo...
-
面完 AIGC 大模型算法岗,心态崩了。。。
大家好,今天我们继续聊聊 AI 科技圈发生的那些事。 内容包括:AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化!Meta 推新一代SAM 2 官方链接:https://ai.meta.com/blog/se...
-
探索未来视觉艺术的前沿:Stable Diffusion Web UI
探索未来视觉艺术的前沿:Stable Diffusion Web UI sygil-webuiStable Diffusion web UI项目地址:https://gitcode.com/gh_mirrors/sy/sygil-webui 在这个...
-
盘点目前有关数字人的开源项目
近年来,数字人技术的迅猛发展吸引了众多研究者和开发者的关注。开源社区也涌现出许多优秀的项目,为数字人技术的发展提供了强有力的支持。本文将对一些目前较为热门的数字人生成相关开源项目进行分类整理和总结,以供广大开发者和研究人员参考。 一、动画人像生成与动作...
-
在AIGC时代,程序员如何保持并提升核心竞争力
随着AIGC(如ChatGPT、MidJourney、Claude等)大语言模型接二连三的涌现,AI辅助编程工具日益普及,程序员的工作方式正在发生深刻变革。 有人担心AI可能取代部分编程工作,也有人认为AI是提高效率的得力助手。 面对这一趋势,程序...
-
开源项目Llama.cpp指南
开源项目Llama.cpp指南 llama.cppPort of Facebook's LLaMA model in C/C++项目地址:https://gitcode.com/gh_mirrors/ll/llama.cpp 1. 项目介绍 Ll...
-
5分钟教你用AI做表情迁移,让一只猫萌萌哒的唱歌。
昨天在群里看到海辛发的一个视频,直接给我萌化了。 喜欢到爆炸。 视频是这样的。 猫唱歌!!!而且唱起来这么可爱这么呆萌!!! 很多人在问是怎么做的,其实真的蛮简单的,毕竟是AI,AI的东西,一般就是有手就行,你懂的。 这个项目,就是WAIC期间,快手开源...
-
深度探索:Dreambooth与Stable Diffusion的梦幻交织
深度探索:Dreambooth与Stable Diffusion的梦幻交织 项目介绍 梦想启航,艺术与技术的碰撞——Dreambooth for Stable Diffusion。这一项目巧妙地结合了当下热门的人工智能领域两大神器:Stable Dif...
-
AI绘图赚钱,普通人用Stable diffusion 还是Midjourney,他们有什么区别?
给大家用2000字说一下Stable Diffusion 和Midjourney 从前期部署→到操作生成→再到效果及应用,为你分析两者之间的区别。 SD控制性极强,可高度自定义,难度大,完全免费。 MJ对小白非常友好,图片质量高,模型有限,插件少,控制...
-
智能体类型探索:从专精到全能,AIGC的多样化应用之路
智能体(Agent)作为技术实现的核心组件之一,正以其独特的形态和功能深刻改变着我们的生活和工作方式。从专精一门的垂直智能体到通才全能的水平智能体,乃至两者的融合——混合智能体,每一种都扮演着不可替代的角色。本文将深入探讨这些智能体的定义、优缺点以及它们在...
-
搜集了18个宝藏技术周刊,涵盖前端、产品、UX、AIGC、独立开发、科技(偷偷收藏)
前端技术迭代速度很快,并不是每个人都有时间跟进社区的变化,但是了解下前端最新趋势、前沿知识对技能成长是很有帮助的,只有持续输入,才能更好输出。因此松桑打算搜集有价值的前端周刊,希望大家能从周刊中能够扩展视野、获取灵感。 但是在搜集过程中发现了很多宝藏周刊...
-
【AI绘画系列】分享5个让你艺术细胞炸裂的SD资源
大家好,最近我疯狂研究AI绘画,AI绘画有一种魔力,一坐下就完全不知道时间的流逝(饭都不知道按时吃了),修仙走火入魔了? 目前AI绘画领域最火的就是MJ和SD,社群众说纷纭。各有所长。建议两者都学习一下,然后找到最适合自己的用法。 AI绘画系列将是一系...
-
首轮嘉宾阵容公布,GOTC 2024 即将开启!
8 月 15 日至 16 日,GOTC 2024 将在上海张江科学会堂盛大开启。 GOTC 2024 与上海浦东软件园联合举办,并结合 “GOTC(全球开源技术峰会)” 与 “GOGC(全球开源极客嘉年华)”,是一场面向全球开发者的全新的开源技术盛会。期...
-
独立开发变现周刊:一个 AI 个人穿搭App年收入300万美元
目录 1、PDF Guru Anki: 一款开源以PDF为中心的办公学习工具箱 2、Langflow:一个开源构建多代理和RAG应用程序的可视化框架 3、【粉丝自荐】Color4Bg:一款酷炫的背景图生成工具 4、如何通过Telegram频道实现每月收入...
-
独立开发变现周刊(第142期):一个 AI 个人穿搭App年收入300万美元
目录 1、PDF Guru Anki: 一款开源以PDF为中心的办公学习工具箱 2、Langflow:一个开源构建多代理和RAG应用程序的可视化框架 3、【粉丝自荐】Color4Bg:一款酷炫的背景图生成工具 4、如何通过Telegram频道实现每月收入...
-
SQL AI 工具太贵用不起?开源的更有性价比
在提高效率这方面,AI 的能力是毋庸置疑的。为了更高效地管理和分析数据库中的数据,很多 SQL AI 工具应运而生。 简单一点的 SQL AI 工具可以扩展传统的SQL查询功能,根据自然语言输入自动生成 SQL 查询,这降低了使用SQL的门槛,即使非技术...
-
盘点5款主流AI绘画工具
传统的绘画往往是由艺术家个人的想象和技巧构建而成,而通过AI绘图,艺术家不再是孤独的创作者,而是与智能系统共同参与创作的合作者。AI能够通过分析海量的数据和图像,学习和模仿不同风格和技法,创造出震撼人心的作品,挑战着观众的审美和认知。 AI绘图工具...
-
大模型学习笔记3【大模型】LLaMA学习笔记
文章目录 学习内容 LLaMA LLaMA模型结构 LLaMA下载和使用 好用的开源项目[Chinese-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca Chinese-Alpaca...
-
全球首个真人级AIGC实时渲染数字人模型开源了!
前言 全球首个2D真人级AIGC实时渲染数字人模型开源了! 这是数字人技术界的一次大爆炸,我们即将迈入一个全新的交互时代,一个由数字人代理引领的时代。 DUIX(Dialogue User Interface System),这个由硅基智能打造...
-
产品体验测评:使用阿里云操作系统智能助手OS Copilot解锁操作系统运维与编程
如何理解李彦宏说的“不要卷模型,要卷应用” 7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举办。在产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏呼吁:“大家不要卷模型,要卷应用!”李彦宏认为,AI技术已经从...
-
推荐开源项目:Whisper - 实时语音转文本的利器
推荐开源项目:Whisper - 实时语音转文本的利器 1、项目介绍 Whisper 是一个由 OpenAI 制作的开源项目,它提供了一个强大的工具,能够将音频转换为文本。该项目基于 whisper.cpp 并利用 FFMPEG 进行音频格式转换,可以...
-
Fastgpt接入Whisper本地模型实现语音输入
前言 FastGPT 默认使用了 OpenAI 的 LLM 模型和语音识别模型,如果想要私有化部署的话,可以使用openai 开源模型Whisper。参考文章 《openai 开源模型Whisper语音转文本模型下载使用》 开源项目地址 : 兼容op...
-
Llama 3 与 GPT-4:哪个更好?
Llama 3 和 GPT-4 是目前公开可用的两种最先进的大型语言模型(LLM)。让我们通过比较这两个模型的多模态性、上下文长度、性能和成本,来看看哪个 LLM 更好。 什么是 GPT-4? GPT-4 是 OpenAI 开发的最新大型语言模型(...
-
如何利用文心一言辅助技术选型
文心一言介绍 一、概述 文心一言(ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品。它能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 二、技术特点 1. 大模型技术 文心大模型:文心一言背后依托...
-
关于AI绘画的模型、开源项目、工具、技巧的学习
目录 一、AI绘画的大模型有哪些? 二、Stable Diffusion是一个流行的AI绘画开源项目。 三、AI绘画的开源工具有哪些? 四、AI绘画的技巧 五、最简单的实践 一、AI绘画的大模型有哪些? AI绘画领域中存...
-
推荐一款革命性代码助手 - Ollama Copilot
? 推荐一款革命性代码助手 - Ollama Copilot 在程序员的世界里,一个好的辅助工具就像是一位智慧的导师,能指引我们突破编程的迷雾,让代码书写变得轻松而高效。今天,我将为大家带来一个全新的开源项目——Ollama Copilot。它不仅融合了...
-
探索多模态智能边界:Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南
探索多模态智能边界:Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南 在人工智能领域,多模态学习正逐渐成为研究热点,它旨在融合视觉和语言信息,构建能够理解和生成跨模态内容的智能体。Visual-Chinese-LLaMA...
-
Mozilla 开源 llamafile:大语言模型分发与部署新范式
引言 随着 ChatGPT、BERT 等大型语言模型(Large Language Model, LLM 在自然语言处理领域掀起巨大波澜,AI 技术正以前所未有的速度走近大众生活。然而,这些 LLM 的训练和推理对计算资源提出了极高要求,动辄数十甚至数百...
-
政安晨【零基础玩转各类开源AI项目】解析开源:Stable Diffusion 3 论文及用户界面工具 StableSwarmUI
目录 关键成果 性能 结构细节 通过重新配重改善整形流量 比例整形变换模型 灵活的文本编码器 使用模型:StableSwarmUI 开源项目的现状: 政安晨的个人主页:政安晨 欢迎 ?点赞✍评论⭐收藏 收录专栏: 零基...
-
半年估值数亿,1000亿美元超级赛道跑出“AI猛兽”
去年,谷歌发布了一份忧心忡忡的内部文件:“虽然谷歌与OpenAI(在大模型上)你追我赶,但双方都没有真正的护城河,因为第三股力量正在崛起——开源社区才是谷歌和OpenAI最大的敌人。” 谷歌的担忧正逐渐变成了现实。 马斯克的开源大模型公司xAI近期完成60...
-
开源项目推荐:openai-whisper-talk —— 智能语音对话新时代
开源项目推荐:openai-whisper-talk —— 智能语音对话新时代 项目地址:https://gitcode.com/supershaneski/openai-whisper-talk 在语音交互的前沿领域,有一颗璀璨的新星正在升起——op...
-
推荐项目:Stable Diffusion WebUI - WD14 Tagger
推荐项目:Stable Diffusion WebUI - WD14 Tagger 项目地址:https://gitcode.com/toriato/stable-diffusion-webui-wd14-tagger 项目简介 Stable Dif...
-
GitHub Copilot 支持 IntelliJ IDEA啦,插件装起来!,蚂蚁金服产品岗面试
安装重启之后就可以在工具栏看到安装好的Copilot 然后登陆GitHub账号,同意相关条款 那说了那么久,这款号称可以自动编码的插件具体使用效果如何呢?就让TJ君带你领略一下或许是未来的编码趋势与潮流: 例如在项目里新建了test类,Cop...
-
Stable Diffusion AMD加速方法-ZLUDA重出江湖
目前几大开源的Stable Diffusion平台,更新速度都慢了,一个是没有太多新技术出现,新出的基础模型也都不完整开源了(API调用),能整的功能,也都整得差不多了。然后一群AMD死忠还在等着有一个能有一天小三上位;毕竟现在还被CUDA压...
-
AIGC技术:开启内容创作的未来之门
在数字化浪潮的推动下,AIGC技术正以其惊人的创造力和效率,重塑内容产业的版图。本文将带您走进AIGC的神奇世界,一探其如何成为内容创作者的得力助手,以及它为整个行业带来的革命性变化。 想象一下,一个能够理解你的需求、自动生成文章、设计图像甚至制作视频的...
-
探索Whisper Streaming:实时语音转文本的高效解决方案
探索Whisper Streaming:实时语音转文本的高效解决方案 项目地址:https://gitcode.com/ufal/whisper_streaming Whisper Streaming 是一个强大的开源项目,由捷克布尔诺科技大学UF...
-
【AIGC调研系列】进行大模型调用开发使用的框架有哪些
AIGC大模型进行调用开发使用的框架包括但不限于以下几种: LangChain:这是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型(LLM)和聊天机器人驱动的应用程序的过程[8...
-
OceanPen Art AI绘画系统 运营教程(四)开源代码-程序员的福利
演示站点: https://ai.uaai.cn 创作模块 官方论坛: www.jingyuai.com 京娱AI 只为交个朋友,大家一起在AI绘画领域大展宏图 一、功能介绍: ✅现有功能 1.登陆注册方式:邮箱+手机号码(...
-
MVP 聚技站|生成式 AI 系列(五):M365 极致驾驭 - Copilot 实战攻略
点击蓝字 关注我们 MVP 聚技站 微软最有价值专家推出“MVP 聚技站”系列主题专栏,邀请多位微软最有价值专家,针对初学者、开发者感兴趣的技术话题,带来专业的技术课程讲解与实践经验分享,帮助大家更快掌握最新的技术技能。 随着人工智能...
-
探索GGUF:利用llama.cpp高效运行大型语言模型
探索GGUF:利用llama.cpp高效运行大型语言模型 在人工智能领域,大型语言模型(LLM)的应用越来越广泛,但运行这些模型常常需要大量计算资源和复杂的配置。最近,一个名为llama.cpp的开源项目引起了广泛关注,它通过C/C++实现了一个高效的...