-
马斯克兑现承诺,Grok模型携3140亿参数强势开源,商业用途全免费!
马斯克确实以其高效率和大胆的行动著称,最近他旗下的AI初创企业xAI宣布了一项引人注目的举措:开源了一个名为Grok-1[1]的混合专家模型。 这个模型拥有3140亿个参数,是目前参数量最大的开源大型语言模型之一,而允许商用、可修改和分发,对各种自研...
-
DECO: 纯卷积Query-Based检测器超越DETR!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标题:DECO: Query-Based End-to-End Object Detection with ConvNets 论文:https://arxiv.org/pdf/2312.13735...
-
AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用
背景 现实世界,人跟人的沟通相当一部分是语音沟通,比如打电话,聊天中发送语音消息。 而在程序的世界,大部分以处理字符串为主。 所以,把语音转换成文字就成为了编程世界非常普遍的需求。 Whisper 是由 OpenAI 开发的一种高效的语音识别(AS...
-
Mac电脑本地安装Stable Diffusion小白教程避开所有坑教程
CPU可为intel或M芯片。特别说明github拉取代码时需要魔法上网,所以尽量全程开启魔法上网。本教程所用系统为macOs venture 13.6.4。 启动“终端” 按下“command+空格”按钮,输入终端,如...
-
huggingface的diffusers训练stable diffusion记录
代码:https://github.com/huggingface/diffusers/tree/main/examples/text_to_image 2006.11239.pdf (arxiv.org 论文 2006.11239.pdf (ar...
-
机器学习:Github上排名前19个强化学习 (RL)项目
强化学习 (RL 是一种机器学习,使代理能够通过反复试验来学习。强化学习算法用于各种应用,包括游戏、机器人和金融。 RL 的目标是找到一种最大化预期长期回报的策略。强化学习算法通常分为两类:基于模型的算法和无模型的算法。基于模型的强化学习算法构建环境模...
-
无需训练,Fast-DetectGPT让文本检测速度提升340倍
大语言模型如 ChatGPT 和 GPT-4 在各个领域对人们的生产和生活带来便利,但其误用也引发了关于虚假新闻、恶意产品评论和剽窃等问题的担忧。本文提出了一种新的文本检测方法 ——Fast-DetectGPT,无需训练,直接使用开源小语言模型检测各种大...
-
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年 5 月,动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。 实现这一效果的研究出自华人一作领衔的「Drag Your GAN」论文,于上个月放出并已...
-
探索编程新纪元:Code GeeX、Copilot与通义灵码的智能辅助之旅
在人工智能技术日新月异的今天,编程领域的革新也正以前所未有的速度推进。新一代的编程辅助工具,如Code GeeX、Copilot和通义灵码,正在重塑开发者的工作流程,提升编程效率,并推动编程教育的普及。本文将深入探讨这三款工具的特点、优势与局限,为开发者提...
-
微软AI程序员登场,10倍AI工程师真来了?996自主生成代码,性能超GPT-4 30%
全球首个AI程序员Devin的横空出世,可能成为软件和AI发展史上一个重要的节点。 它掌握了全栈的技能,不仅可以写代码debug,训模型,还可以去美国最大求职网站Upwork上抢单。 一时间,网友们惊呼,「程序员不存在了」? 甚至连刚开始攻读计算机学位...
-
一键点、万物动! 腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 3月15日,腾讯混元和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“,基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原...
-
巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数
传统的时空预测模型通常需要大量数据支持才能取得良好效果。 然而,由于城市发展水平不均衡和数据收集政策的差异,许多城市和地区的时空数据(如交通和人群流动数据)受到了限制。在这种情况下,模型在数据稀缺情况下的可迁移性变得尤为重要。 现有研究主要利用数据丰富的...
-
AI大模型控制红绿灯,港科大(广州)智慧交通新成果已开源
大模型“上路”,干起了交通信号控制(TSC)的活~ 模型名为LightGPT,以排队及不同区段快要接近信号灯的车辆对路口交通状况分析,进而确定最好的信号灯配置。 该模型由香港科技大学(广州)的研究团队提出,其背后关键是一个名为LLMLight的框架。...
-
别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元
不久前OpenAI Sora以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。 继2周前推出成本直降46%的Sora训练推理复现流程后,Colossal-AI团队全面开源全球首个类Sora架构视频生成模型「Open-Sor...
-
Stable Diffusion——常用插件安装与测试(一)
前言 随着Stable Diffusion不断演进,越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程,但它们通常零散分布,逐个学习和查找非常耗时,使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。 感...
-
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
马斯克说到做到: 旗下大模型Grok现已开源! 代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型—— 就是说,这是当前开源模型中参数量最大的一个。 消息一出,Grok-1的GitHub仓库已揽获4...
-
全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重
全球首个开源的类Sora架构视频生成模型,来了! 整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。 这就是刚刚发布的Open-Sora 1.0。 它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。 还能用航拍视角,展现悬崖海岸边,海水...
-
Stable Diffusion WebUI 笔记本低显存无魔法本地安装使用(五)--- 插件安装
一、 查找插件 1. 启动webui,在打开的页面上,点击 extensions,点击 Available 2. 点击“Load from”黄色按钮,会列出所有的可用插件,查找你的插件,如果是汉化的插件,请去掉localization的选择 3....
-
马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星
说到做到,马斯克xAI的Grok,果然如期开源了! 就在刚刚,xAI正式发布3140亿参数混合专家模型Grok-1的权重和架构。 3140亿的参数,让Grok-1成为迄今参数量最大的开源LLM,是Llama 2的4倍。 目前,xAI关于Grok-1...
-
淘宝人生2的AIGC技术应用——虚拟人写真算法技术方案
近几个月,随着基于Stable Diffusion的相关技术发展,基于参考图的角色定制化技术[1,2, 3, 4, 7]受到相关行业以及学者的广泛关注。其中,人像定制化是指:给定任务角色(参考图),通过提示词控制生成多样新的图像,并且图像...
-
stable diffusion采样详解
采样:模型会在Latent Space中生成一个完全随机的图像,然后噪声预测器会从图像中减去预测的噪声。随着这个步骤的不断重复,最终得到一个清晰的图像。 Stable Diffusion在每个步骤中都会生成一张新的采样后的图像,整个去噪...
-
自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
基于 Transformer 结构的视觉语言大模型(VLM)在各种下游的视觉语言任务上取得了巨大成功,但由于其较长的输入序列和较多的参数,导致其相应的计算开销地提升,阻碍了在实际环境中进一步部署。为了追求更为高效的推理速度,前人提出了一些针对 VLM 的...
-
【Datawhale组队学习:Sora原理与技术实战】AIGC技术基础知识
AIGC是什么 AIGC全称叫做AI generated content,AlGC (Al-Generated Content,人工智能生产内容 ,是利用AlI自动生产内容的生产方式。 在传统的内容创作领域中,PGC(Professionally-g...
-
马斯克旗下xAI宣布开源Grok-1 包含3140亿参数
今日,马斯克旗下xAI宣布开源Grok-1。据悉,Grok-1基础模型基于大量文本数据训练,共有3140亿参数。该模型使用基于 JAX 和 Rust 的自定义训练堆栈进行训练。 而xAI 是埃隆・马斯克成立的人工智能公司,于2023年7月12日宣布成立。...
-
手把手教你搭建更节省显存的AI绘画工具ComfyUI
前言 相信大家玩 Stable Diffusion(以下简称 SD)都是用的 web UI 操作界面吧,不知道有没有小伙伴听说过**ComfyUI(**最强大、模块化的稳定扩散 GUI 。 // ComfyUI示例 https://comfyanon...
-
没等来OpenAI,等来了Open-Sora全面开源
不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模...
-
ChatGPT的前辈GPT-2被塞入Excel表格:体积达1.25GB之巨!
快科技3月17日消息,Excel真是无所不能,酷爱它的软件开发者Ishan Anand居然将OpenAI GPT-2大模型硬生生放到了Excel之中,体积达到1.2GB,关键是还能正常运行! 我们熟悉的ChatGPT,其实支持GPT系列大模型的一种呈现形式...
-
AI程序员Devin卧底工作群修bug!和CTO聊技术,网友:顶级码农水平
首个AI程序员Devin,现身明星创业公司内部群。 为解决一个技术问题,Devin借用了其创造者的账号,与客户公司的CTO交流,并根据回复调整了代码方案。 对话之专业,围观者看了直呼这个世界太疯狂。 事情发生在办公软件Slack,截图中的akshat是...
-
大模型学习笔记(一):部署ChatGLM模型以及stable-diffusion模型
大模型学习笔记(一):部署ChatGLM模型以及stable-diffusion模型 注册算力平台(驱动云平台) 1.平台注册 2.查看算力 3.进入平台中心 部署ChatGLM3-6B模型 1.创建项目 2.配置环境 设置镜像源、克隆...
-
小妙招:Copilot 当跳板免费调用 GPT4
GPT4 每月 20 刀,Github Copilot 每月 10 刀 首先叠个甲:免费不是 0 成本。 由于我在日常开发过程中,Copilot 对我来说是必需品,我会用它检查代码、写工具函数、写注释、干苦力。所以这钱是我的必要支出。而这篇文章是介...
-
利用学生认证部署 copilot-gpt4-service 白嫖 gpt-4.0
过年期间在公众号 HelloGitHub 上看到了一个项目 copilot-gpt4-service,可以将 GitHub Copilot 转成 ChatGPT 的服务。 这么一个转换的好处是, GitHub 可以通过学生认证免费试用,转换成 ChatGP...
-
Stable Diffusion 跑通总结
记录了自己跑通Stable Diffusion的过程和踩过的坑,目前只是初步跑了一下,没有很深入的使用代码,希望能有一些参考价值。 在Windows系统运行,需要提前装好Conda 一、下载代码和模型 1、下载代码: 代码下载:代码地址 或者...
-
20240203在WIN10下配置stable-diffusion-webui.git
20240203在WIN10下配置stable-diffusion-webui.git 2024/2/3 11:55 【结论:在WIN10下,生成512x512分辨率的图像,大概需要9秒钟!】 【结论:在Ubuntu20.04.6下,生成512x512...
-
【AIGC调研系列】Github Copilot进行pytest自动化测试的实践经验
GitHub Copilot可以用于pytest自动化测试的实践和使用方法。此外,Copilot可以在很多情况下仅通过注释或函数名就能实例化出完整的代码,这表明它也可以用于补充测试用例[5]。 具体到pytest框架,它是一个非常容易上手的自动化测试框架...
-
人工智能让 GitHub 首席法务官忙于应对欧盟的 AI 法案以及开发者对 Copilot 和所有权的担忧
GitHub 的首席法务官 Shelley McKinley 一周以来日程繁忙。除了处理与其 Copilot 配对编程工具的相关法律问题外,欧盟新近通过的人工智能法案也为其带来了额外的工作负担。这项被誉为「全球首个全面覆盖的人工智能法律」,经过三年的酝酿,...
-
Copilot 插件的使用介绍:让你的开发效率翻倍
摘要:Copilot 是一款强大的代码自动完成插件,能够帮助开发者提高开发效率,减少重复性劳动。本文将详细介绍 Copilot 插件的使用方法,让你轻松上手,开启编程新篇章。 一、Copilot 插件简介 Copilot 是由 GitHub 开发的一款代...
-
Stable diffusion安装以及汉化
安装参考:https://blog.csdn.net/weixin_72959097/article/details/136261658 (1)下载miniconda Miniconda是一个轻量级的包管理系统,用于管理和部署Python环境和软件包。...
-
【学习笔记】:Ubuntu 22 使用模型量化工具llama.cpp部署大模型 CPU+GPU
学习笔记:Ubuntu 22 使用模型量化工具llama.cpp部署大模型 CPU+GPU 前言 1 下载并编译llama.cpp 1.1 git下载llama.cpp仓库源码 1.2 编译源码(make) 1.2.1 选择一:仅在CPU上...
-
Stable Diffusion WebUI安装报错解决
本人是一个AI新手,最近在研究文生图方面相关内容时看到Stable Diffusion WebUI这个项目,想在本地部署安装试用看下效果,安装过程中遇到了一些问题,此处记录一下 问题1:Python 3.12.1 (tags/v3.12.1:2305ca...
-
LLaMA-Factory 8卡4090 deepspeed zero3 微调Qwen14B-chat
环境安装 推荐使用docker,Ubuntu20.04https://www.modelscope.cn/docs/%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85 docker pull registry.cn-beijin...
-
AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程
免责声明: 本案例所用安装包免费提供,无任何盈利目的。 大家好,我是风雨无阻。 想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。 那么如何才能拥有一个免费...
-
》 ==== 摘要: Discuz!作为中国普及最广泛的论坛建设工具体系之一,在企业建设和站内信息发布系统的数据来源池子和营收述料的科创端倪撬区中荣奖有条不紊推崇存留争议阳牛的蔽喉厮棕主干老式 getData 齐汾馆长扫描仪惊悚世界中题充了有着非常厚望醒目的打底操作工晶体赐予悄然烟云支队电厂仅凭那边ER集聚马赫学龄志愿者发展情况抗干扰神学 sign上网 兴趣 vortex千篇悲剧又用eric状语从句谓之创作的(/ bumper夷迟早 opport午休 pedagogy牵牛 News额太和 pl
由于文章的具体要求细节并非非常具体(例如关于Discuz 3.0采集的详细内容或者观点的偏重),在这里我无法创作出一个精准的、贴合实际背景的2000字深度好文,因此会以模拟的文章轮廓概述以及一些填槽句子、要点的内容编排等来演绎此类型的创作活动,最终达到用近...
-
MACBOOK PRO M2 MAX 安装Stable Diffusion及文生图实例
以前偶尔会使用Midjourney生成一些图片,现在使用的头像就是当时花钱在Midjourney上生成的。前段时间从某鱼上拍了一台性价比还不错的macbook,想着不如自己部署Stable Diffusion(以下简称SD)尝试一下。 网上有很多教程,但...
-
Stable diffusion(二)
SD colab安装 https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast_stable_diffusion_AUTOMATIC...
-
集成使用 GitHub Copilot 提升 IDEA 开发效率
集成使用 GitHub Copilot 提升 IDEA 开发效率 在现代软件开发中,集成开发环境(IDE)如IntelliJ IDEA已经成为开发人员不可或缺的工具。它们提供了代码编辑、调试、版本控制等一系列功能,极大地提高了开发效率。而GitHub C...
-
Whisper实现语音识别转文本
#教程 主要参考开源免费离线语音识别神器whisper如何安装,OpenAI开源模型Whisper——音频转文字 Whisper是一个开源的自动语音识别系统,它在网络上收集了680,000小时的多语种和多任务监督数据进行训练,使得它可以将多种语言的音频...
-
发现 AI 宝藏:你不能错过的AI产品推荐
hi, 大家好, 我是徐小夕, 一名前端资深玩家. 今天暂时不分享前端技术, 带大家聊聊AI和AIGC产品。 这两年AI非常火, 国内也涌现出很多AI相关的产品. 作为一名非AI专业人才,怎么去做AI产品呢? 这个也是我一直探索的课题. 好在很多AI项...
-
GenAI提高工作效率的三个领域,直到超过其极限
尽管GenAI是一项相对较新的技术,但考虑到它正在产生的影响和它可以创造的商业价值,现在很难想象没有它的世界会是什么样子。 根据IDC去年11月发布的一份研究报告,基于对2100多名负责人工智能转型的商业领袖和决策者的调查,已经使用人工智能的企业中,7...
-
通过Likeshop采集插件提升电商效率与质量的关键洞见
在互联网的高速公路上,电子商务以其快捷、高效和突破地理限制的优势成为了商业的一股强势力量。但对于电商运营者而言,如何快速精准地从浩瀚如海的信息中获取关键数据和商品详情是一项挑战。“likeshop采集插件”就仿佛是这个问题的一款解题利器,不仅能节省人工信息...
-
图技术在 LLM 下的应用:知识图谱驱动的大语言模型 Llama Index
LLM 如火如荼地发展了大半年,各类大模型和相关框架也逐步成型,可被大家应用到业务实际中。在这个过程中,我们可能会遇到一类问题是:现有的哪些数据,如何更好地与 LLM 对接上。像是大家都在用的知识图谱,现在的图谱该如何借助大模型,发挥更大的价值呢? 在本...