-
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
作为 2024 开年王炸,Sora 的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。 根据 OpenAI 披露的技术报告,Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式,并通过 Tr...
-
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存
陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法: 它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。 最重要的是,在这个过程中,只需要原来1/6的内存,模型就获得了10倍吞吐量。 除此之外,它还能大大降低训练成本:...
-
用GGUF和Llama .cpp量化Llama模型
用GGUF和Llama .cpp量化Llama模型 什么是GGML 如何用GGML量化llm 使用GGML进行量化 NF4 vs. GGML vs. GPTQ 结论 由于大型语言模型(LLMS)的庞大规模,量化已成为有效运行它们的必要...
-
Github Copilot 程序员效率提升工具
AI时代到来,Github Copilot问世 以下是GitHub的首席执行官 Thomas 在2022年6月21日,首次将Github Copilot面向个人开发者全面开放的公告。 什么是 Github Copilot 简单来说就是能帮助程...
-
英伟达、Hugging Face和ServiceNow发布用于代码生成的新StarCoder2 LLM
这些模型目前有三种不同的大小,已经在600多种编程语言(包括低资源语言 上进行了培训,以帮助企业在其开发工作流中加速各种与代码相关的任务,它们是在开放的BigCode项目下开发的,该项目是ServiceNow和Huging Face联合发起的,以确保...
-
AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说RAP
Sora之后,居然还有新的AI视频模型,能惊艳得大家狂转狂赞! 图片 有了它,《狂飙》大反派高启强化身罗翔,都能给大伙儿普法啦(狗头)。 这就是阿里最新推出的基于音频驱动的肖像视频生成框架,EMO(Emote Portrait Alive)。 有了它,...
-
【直播预告】程序员逆袭CEO分几步?
2024年,是充满未知和挑战的一年。AI 的发展日新月异,已经有人用它来写代码了,啥时候会替代程序员,可真不好说。另一方面,程序员扎堆的 IT 互联网行业却进入了平台期甚至下行期,降本增效成为行业主流,裁员缩招的声音不绝于耳。在这种前有狼后有虎的年头,作为...
-
stable diffusion 基础教程-提示词之光的用法
基图 prompt: masterpiece,best quality,1girl,solo,looking at viewer,brown hair,hair between eyes,bangs,very long hair,red eyes,b...
-
厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型
图像匹配是计算机视觉的一项基础任务,其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位和神经渲染 (neural rendering 等的基础和前置步骤,其精确度和效率对于后续处理十分重要。 传统算法(SIFT)在面临...
-
GitHub推出面向企业的AI编码助手Copilot Enterprise
GitHub新推出的名为GitHub Copilot Enterprise的产品是一款AI助手,可以根据企业自己的代码库和标准生成代码建议、回答查询并汇总更改。专家表示,这一新服务标志着软件工程团队在不久的将来将如何运营的巨变,基本上是让每一位开发人...
-
Llama中文大模型-模型部署
选择学习路径 快速上手-使用Anaconda 第 0 步:前提条件 确保安装了 Python 3.10 以上版本。 第 1 步:准备环境 如需设置环境,安装所需要的软件包,运行下面的命令。 git clone https:/...
-
windows 下跑起大模型(llama)操作笔记
原贴地址:https://testerhome.com/topics/39091 前言 国内访问 chatgpt 太麻烦了,还是本地自己搭一个比较快,也方便后续修改微调啥的。 之前 llama 刚出来的时候在 mac 上试了下,也在 windows...
-
知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特
就在几天前,开源大模型领域迎来了重磅新玩家:谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。 谷歌发布了包含两种权重规模的模型:Gemma 2B 和 Gemma...
-
ChatGPT编程时代来啦,GitHub Copilot Enterprise正式发布!
2月28日,全球最大开源平台之一GitHub在官网宣布——GitHub Copilot Enterprise正式全面发布。 GitHub Copilot Enterprise核心模块之一GitHub Copilot,是一款基于OpenAI的GPT-4模型,...
-
揭秘「 B 站最火的 RAG 应用」是如何炼成的
近日,bilibili 知名科技 UP 主“Ele 实验室”发布了一个视频,标题为“当我开发出史料检索 RAG 应用,正史怪又该如何应对?” 。 视频连续三天被平台打上“热门”标签,并迅速登上科技板块全区排行榜前列。截至目前,视频的观看量近 70 万,评...
-
每日AI:Pika推出Lip Sync功能;阿里推对口型视频生成工具EMO;DomoAI推fusion style功能;GitHub上线Copilot Enterprise通用版本
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 Pika推出Lip...
-
ChatGPT大战Copilot,谁才是最强王者
巨人之战:GitHub Copilot vs ChatGPT ⚔️⚔️ 微信搜索关注《Java学研大本营》,加入读者群,分享更多精彩 ChatGPT的发布在编程社区引起了波澜,因为它可以产生令人难以置信的代码片段。 它与去年发布的GitHub...
-
copilot和chatGPT的区别
区别: Copilot和ChatGPT是由OpenAI开发的两个不同的工具,用于不同的任务和场景。以下是它们的主要区别: 用途: ChatGPT: ChatGPT是一个生成式语言模型,设计用于与用户进行自然语言交互。它被训练用于回答用户提...
-
在云服务器中部署stable diffusion webui教程。
要在云服务器中部署Stable Diffusion WebUI,你可以按照以下步骤进行操作: 准备环境: 获取一台云服务器,例如使用云服务提供商(如AWS、Azure、阿里云等)创建一个虚拟机实例。 确保服务器的操作系统满足Stable Di...
-
Stable Diffusion WebUI 安装前准备
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 在安装 stable-diffusion-webui 前需要做一些准备工作,本篇文章主要介绍需要的电脑配置、魔法、安装 Python、安装 Git 等。...
-
【GitHub项目推荐--AIGC! 人工智能漫画生成器!漫画、冒险游戏、Galgame制作工具】【转载】
Ren'Py 用人工智能生产内容!最近抖音上赵本山、范伟读英语、外国人讲故事……这些都是人工智能的视频获得百万阅读量! 自己做漫画、自己做游戏吧! Ren'Py是一款开源的视觉小说、冒险游戏、Galgame制作工具,可免费用于商业用途。 githu...
-
值得一试的五大AI编程助手
译者 | 布加迪 审校 | 重楼 AI编程助手已成为开发过程中不可缺少的一部分,因为它们可以协助代码生成、理解、项目搜索以及使用提示或代码执行各种任务。甚至像谷歌Colab和Deepnote这样的云IDE平台也提供AI辅助编程,可以帮助您生成代码并解决问...
-
真快!几分钟就把视频语音识别为文本了,不到10行代码
大家好,我是风筝 将音视频文件中的音频转为文字内容,这个需求放到两年前还不大好实现,但是放到今天,几分钟就解决了。 听说有的公司为了抓取训练数据,已经把抖音、快手这些短视频平台上的视频扒了个遍,然后将其中的音频提取成文本,用作大数据模型的训练语料。 如果...
-
自动驾驶与轨迹预测看这一篇就够了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈...
-
Stable Diffusion学习指南【安装篇】
在上一篇的教程中,我为大家介绍了Stable Diffusion的原理、发展历程和优点,大家应该对Stable Diffusion这款AI绘画工具有了初步的了解,而这一篇我将教你如何在自己电脑上轻松部署WebUI。 Stable Diffusion历史文...
-
【Llama2 windows部署详细教程】第二节:llama.cpp成功在windows上编译的秘诀
Llama2 开源大模型推出之后,因需要昂贵的算力资源,很多小伙伴们也只能看看。好在llama.cpp推出之后,可对模型进行量化,量化之后模型体积显著变小,以便能在windows CPU环境中运行,为了避免小伙伴们少走弯路,下面将详细介绍llama.cpp...
-
Stable Diffusion ComfyUI安装详细教程
上一篇文章介绍了sd-webui的安装教程,但学习一下ComfyUI这种节点流程式的对理解AI绘画有较大帮助,而且后期排查错误会更加方便,熟练后用这种方式做AI绘画可玩性会更多。 文章目录 一、安装包说明 二、安装文件介绍 三、安装步骤...
-
高通推出AI Hub,方便开发者在设备上访问和下载AI模型
随着在个人设备上的设备 AI 变得更加普及。在世界移动通信大会上,高通推出了一款工具AI Hub,简化了开发人员如何将 AI 模型直接下载到测试设备上的过程。 新的高通 AI Hub 包含了一个库,其中包含超过75个生成式 AI 模型,开发人员可以轻松地...
-
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA) 介绍:首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库,训练出一个具有中医知识理解力的预...
-
详解各种LLM系列|(2)LLaMA 2模型架构、 预训练、SFT内容详解 (PART-1)
一、引言 Llama 2是Meta在LLaMA基础上升级的一系列从 7B到 70B 参数的大语言模型。Llama2 在各个榜单上精度全面超过 LLaMA1,Llama 2 作为开源界表现最好的模型之一,目前被广泛使用。 为了更深入地理解Llama 2的...
-
AIGC应用:Stable diffusion webui基本使用技巧
文章目录 前言 一、Stable Diffusion Web UI 安装 二、泡泡玛特(prompt) 三、txt输入规则 四、交替渲染 五、Lora模型调用 六、Hypernetwork & Embeding 七、采样器(sample...
-
Llama中文大模型
关于Llama中文大模型 欢迎来到Llama中文大模型:已经基于大规模中文数据,从预训练开始对Llama2模型进行中文能力的持续迭代升级。 Llama中文大模型 :https://github.com/LlamaFamily/Llama-Chine...
-
高性能 LLM 推理框架的设计与实现
一、大语言模型推理概要介绍 与传统的 CNN 模型推理不同,大语言模型的推理通常会分成 prefill 和 decoding 两个阶段。每一个请求发起后产生的推理过程都会先经历一个 Prefill 过程,prefill 过程会计算用户所有的输入,并生...
-
Kubernetes调试终极武器: K8sGPT
随着人工智能和机器学习技术的进步,企业和组织越来越多的探索创新战略,以求利用这些能力来获得竞争优势。 K8sGPT[2]就是该领域最强大的工具之一,它是一种基于k8s的GPT模型,结合了k8s编排的优点以及GPT模型复杂的自然语言处理能力。 什么是K8...
-
高通宣布推出 AI Hub 开发人员在高通设备上运行AI模型
在巴塞罗那世界移动大会上,高通公司推出了多项新技术。该公司发布了Qualcomm AI Hub,这是一款新工具,允许开发人员在高通设备上运行AI模型。 Qualcomm AI Hub 为 Snapdragon 和 Qualcomm 平台提供75多个优化的...
-
AI辅助编程现状:AI工具提高了速度,但错误代码也大幅增加
在软件开发领域,AI工具越来越流行。去年GitHub发布报告称,有了AI辅助工具,开发者编程速度提高55%。 但是,AI工具辅助编写的代码是不是更好呢?GitClear对2020年1月至2023年12月间编写的1.53亿行代码进行检查发现,相比以前,编...
-
「人车交互」新突破!普渡大学发布Talk2Drive框架:可学习/定制的「指令识别」系统
在普渡大学数字孪生实验室的最新成果中,研究人员引入了一种革命性的技术——利用大型语言模型(LLM)为自动驾驶汽车提供智能指令解析能力。 该技术的核心为Talk2Drive框架,旨在通过理解人类的自然语言来控制自动驾驶汽车,从而实现了一种前所未有的人车交互...
-
全网最 2024 GitHub Copilot超详细免费激活教学-干货
全网最🔥 2024 GitHub Copilot免费超详细激活教学 尊重原创,编写不易 ,帮忙点赞关注一下~转载小伙伴请注明出处!谢谢 GitHub Copilot 概述 GitHub Copilot 是由 GitHub 和 OpenAI...
-
huggingface学习|用dreambooth和lora对stable diffusion模型进行微调
目录 用dreambooth对stable-diffusion-v1-5模型进行微调 (一)模型下载和环境配置 (二)数据集准备 (三)模型微调 (四)运行微调后的模型 用lora对stable-diffusion-v1-5模型进行微调...
-
YOLO不死!YOLOv9出炉:性能速度SOTA~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 如今的深度学习方法专注于设计最适合的目标函数,以使模型的预测结果与实际情况最接近。同时,必须设计一个合适的架构,以便为预测获取足够的信息。现有方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换...
-
紧跟时事!一个支持Sora模型文本生成视频的Web客户端
大家好,我是 Java陈序员。 最近 Open AI 又火了一把,其新推出的文本生成视频模型 —— Sora,引起了巨大的关注。 Sora 目前仅仅只是发布预告视频,还未开放出具体的 API. 今天,给大家推荐一个最近十分火热的开源项目,一个支持使用 S...
-
NUS尤洋团队开发扩散模型p-diff 像Sora一样直接打入AI底层
新加坡国立大学尤洋教授团队联合其他机构开发的p-diff扩散模型在AI领域引起热议。这项模型能以44倍的速度生成神经网络参数,得到了深度学习领域的重要人物LeCun的点赞。该模型的研发结合了自编码器的设计,通过正向和反向过程学习参数的分布,生成高质量的神经...
-
使用openai-whisper实现语音转文字
使用openai-whisper实现语音转文字 1 安装依赖 1.1 Windows下安装ffmpeg FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化...
-
出门问问开放大模型“序列猴子”开源数据集
出门问问宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。 序列猴子,作为出门问问的核心技术之一,具备强大的通用表示与推理能力,已在问答系统、自然语言处理、机器翻译、文本摘要等多个领域展现出其卓越的性能,...
-
打入AI底层!NUS尤洋团队用扩散模型构建神经网络参数,LeCun点赞
扩散模型,迎来了一项重大新应用—— 像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层! 这就是新加坡国立大学尤洋教授团队联合UCB、Meta AI实验室等机构最新开源的研究成果。 具体来说,研究团队提出了一种用于生成神经网络参数的扩散模...
-
AIGC 实战:如何使用 Docker 在 Ollama 上离线运行大模型(LLM)
Ollama简介 Ollama 是一个开源平台,用于管理和运行各种大型语言模型 (LLM ,例如 Llama 2、Mistral 和 Tinyllama。它提供命令行界面 (CLI 用于安装、模型管理和交互。您可以使用 Ollama 根据您的需求下载...
-
webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools
python绑定的相关项目 官方未提供python的封装绑定,直接调用执行文件 https://github.com/stlukey/whispercpp.py提供了源码和Cpython结合的绑定 https://github.com/zh...
-
干货满满!大神Karpathy两小时AI大课文字版第一弹,全新工作流自动把视频转成文章
前段时间,AI大神Karpathy上线的AI大课,已经收获了全网15万次播放量。 当时还有网友表示,这2小时课程的含金量,相当于大学4年。 就在这几天,Karpathy又萌生了一个新的想法: 那便是,将2小时13分钟的「从头开始构建GPT分词器」的视频...
-
一手借东风,Reddit把用户「卖」了个好价钱;AI增强搜索工具清单(私藏版);2024年Star飙升的LLM学习路线图;AIGC教育行业全景报告 | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🉑 国产大模型进入生态构建阶段,纷纷出炉开发者激励计划 https://www.moonshot.cn 2月5日,月之暗面 Moonsho...
-
Mac本地部署大模型体验AIGC能力
介绍 随着ChatGPT的横空出世,国内互联网大厂、创业公司纷纷加了AIGC赛道,不断推出各种大模型,而这些大模型由于规模庞大、结构复杂,往往包含了数十亿至数千亿的参数。这些模型在训练阶段,一般需要使用高效能的GPU集群训练数十天时间,在推理阶段,一般...