-
三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法
优化语义分割模型常用的损失有Soft Jaccard损失,Soft Dice损失和Soft Tversky损失,但它们都和软标签不兼容,所以无法支持一些重要的训练技术(例如标签平滑,知识蒸馏,半监督学习,多标注员等)。 另一方面,语义分割常用的评价指标...
-
20240131在ubuntu20.04.6下使用whisper不同模式的比对
20240131在ubuntu20.04.6下使用whisper不同模式的比对 2024/1/31 16:07 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】 2、请正确安装好NVIDIA最新...
-
从0开始用 PyTorch 构建完整的 NeRF
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在解释代码之前,首先对NeRF(神经辐射场)的原理与含义进行简单回顾。而NeRF论文中是这样解释NeRF算法流程的: “我们提出了一个当前最优的方法,应用于复杂场景下合成新视图的任务,具体的实现原理是...
-
LLaVA:GPT-4V(ision) 的开源替代品
LLaVA(大型语言和视觉助理)(链接::https://llava-vl.github.io/)是一个很有前途的开源生成式人工智能模型,它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中,允许讨论这些图像...
-
轻松AI绘画!本地一键部署Stable Diffusion,5秒打造个性龙年吉祥物
智慧引领 共见未来 Ai鲁班 2023年以来人工智能大模型迎来了爆发式增长,其影响已不仅仅局限于科技领域,而是成为推动社会进步的重要引擎。这一创新的突破性进展在全球范围内引起了广泛关注,被认为是迎接科技发展4.0时代的革命性时刻。 AI绘画技术不仅能...
-
企业如何用copilot?电通×Copilot:打破创意工作效率“天花板”
企业申请Azure OpenAI绿色通道 →记得评论私信~还可加入试用交流群~ 电通集团拥有着120年的历史、汇聚了七万多名精英,是全球顶级的创意公司之一。随着新兴传播渠道的不断涌现,电通的客户们面临着内容需求的挑战。好消息是,微软Copilot...
-
Copilot在IDEA中的应用:提升编码效率的得力助手
Copilot在IDEA中的应用:提升编码效率的得力助手 前言: 欢迎来到本篇博客,今天我们将深入探讨 GitHub Copilot 在 IntelliJ IDEA 中的应用。GitHub Copilot 是一款由 GitHub 与 OpenAI...
-
stable diffusion如何确保每张图的面部一致?
可以使用roop插件,确定好脸部图片后,使用roop固定,然后生成的所有图片都使用同一张脸。 这款插件的功能简单粗暴:一键换脸。 如图所示: 任意上传一张脸部清晰的图片,点击启用。 在其他提示词不变的情况下,Stable Diffu...
-
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下?
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下? 2024/1/26 21:19 问GTX1080模式使用large该如何配置呢? 这个问题没有完成,可能需要使用使用显存更大的显卡了! 比如G...
-
AIGC智能编程如何适应并推动开源项目的发展?
AIGC智能编程如何适应并推动开源项目的发展? 开源项目在软件行业中具有重要的地位,它们为开发人员提供了协作和共享代码的机会。AIGC智能编程作为一种创新的编程方法,能够适应和推动开源项目的发展,为开发人员提供更高效、更智能的编程体验。 1. AI...
-
秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作
TensorRT 如何加速 Stable Diffusion? 生成式 AI 图像内容生成技术近年来发展迅速,可以根据人类语言描述生成图片,在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion WebUI 是 Githu...
-
罕见!苹果开源图片编辑神器MGIE,要上iPhone?
拍张照片,输入文字指令,手机就开始自动修图? 这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。 把背景中的人移除 在桌子上添加披萨 最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLL...
-
无需GPU,手机芯片也能运行多模态模型!面壁智能发布MiniCPM,性能超过Mistral-7B!
2月1日,面壁智能发布了旗舰端侧模型 MiniCPM,它以小博大的性能超越了 Mistral-7B,并在 MT-Bench 等榜单上表现出色。 MiniCPM 是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀,而且具有极低的成本...
-
打脸奥特曼,GPT-4今年比去年还懒!网友在线实测出炉
GPT-4变懒的问题,又有新进展。 就在今天凌晨,奥特曼发推称,GPT-4这个毛病在新的一年应该好多了! 图片 关于GPT-4变懒,网友的吐槽已是不计其数,其中最多的就是与代码相关的任务: 完成度不高不说,还会被分割成一个一个小块,使用时需要逐一复制。...
-
大模型系列——解读RAG
RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上,覆盖了结合网络搜索引擎和 LLM 的问答服务,到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构,但什么是RAG呢?R...
-
GPT-4懒癌爆发!代码比较任务中完成率降低近1/4
近期,GPT-4的“懒惰”现象再度成为热议话题。网友们通过实际测试发现,GPT-4在代码比较任务中的表现下降显著,完成率降低了近四分之一。一些用户反馈称,完成度不仅不高,而且生成的文本还会被分割成小块,使用时需要逐一复制,给用户带来不便。 尽管有博主表示...
-
AI对联/春联在网络上走红 打工人又被狠狠共情了
最近,智能春联生成器AI 对联/春联在网络上走红,不少网友纷纷以“A股”“打工人”等为题让AI生成对应的春联。还别说,就从“程序维护忙像狗”“千股跌停迎新春”这些对联来看,AI已经拿捏了普通人的心理。 项目地址:https://github.com/Y...
-
比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上
论文地址: https://arxiv.org/abs/2312.16171 Github地址: https://github.com/VILA-Lab/ATLAS 论文标题:Principled Instructions Are All You...
-
ChatLaw:基于LLaMA微调的法律大模型
文章目录 动机 数据组成 模型框架 模型评估 北大团队发布首个的中文法律大模型落地产品ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。 github地址:https://g...
-
如何使用单个指令微调GPT-3.5或Llama 2
由于在各种任务中的通用性,像ChatGPT和Llama 2这样的大型语言模型(LLM 广受欢迎。然而,有些应用程序需要使用自定义数据对这些模型进行微调,以获得更好的性能。 不幸的是,针对特定应用程序对大型语言模型(LLM 进行微调通常是复杂和令人沮丧的...
-
“要嫁中国男人”,你被AI数字美女骗了吗?
大家好,我是轩辕。 不知道大家最近刷短视频的时候有没有刷到过这种视频: 一个漂亮的外国美女,自称来自俄罗斯,说着带口音的中国话,一个劲的夸中国这好那好,然后还要嫁给中国男人。 偶尔刷到也就罢了,然而最近发现了不对劲,这女的出现的频率越来越高,而且还是在不...
-
流量工程将代码生成的准确率提高一倍:由19%提高至44%
一篇新论文的作者提出了一种“强化”代码生成的方法。 代码生成是人工智能中一项越来越重要的能力。它指训练机器学习模型,基于对所需程序功能的自然语言描述自动生成计算机代码,并有许多潜在的应用,从将软件规格转换成实用代码、自动化后端开发到协助人类程序员,不一...
-
AIGC内容分享(五十三):AIGC|深入浅出一个完整的视频生成系统「VGen」核心基础知识
目录 一、VGen整体架构 二、VGen核心基础内容 三、快速上手使用VGen进行视频生成 四、VGen与SVD的比较 一、VGen整体架构 「VGen」是一个基于扩散模型的视频生成系统,提供以视频生成扩散模型为中心的强大代码库,具有先进...
-
RocketMQ Copilot GA 版本全新发布!
RocketMQ Copilot 1.0.0 经过一段时间的开发迭代,终于和大家见面了!1.0.0 相比较于之前提供了更多新特性,同时也在之前版本的基础上做了不少功能增强,是 RocketMQ Copilot 的第一个 GA 版本。在新版本中,Rocket...
-
超简单,不用GPU,3步教你轻松在笔记本上部署聊天大模型 LLaMA
大家好啊,我是董董灿。 今天带大家在自己的电脑(笔记本 上部署一个类似于 chatGPT 的 AI 聊天大模型。 部署完之后,你就拥有了一个私人 AI 聊天机器人,无需联网,随时进行实时对话。 0. 简单说下背景 大模型我们都不陌生了,但是以...
-
【多模态】13、Vision-Language 模型在视觉任务中的调研
文章目录 一、简介 二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集 三、迁移学习 3.1 使用 prompt tunin...
-
Stable diffusion本地环境搭建
1.硬件要求 我的硬件是win10 处理器:英特尔 Core i7-10750H 内存:32G 显卡:显卡:NVIDIA GeForce RTX 3060 Laptop GPU 显存 12 GB 具体性能待测试 2. 系统环境搭建...
-
图感知对比学习提升多变量时间序列分类效果
今天给大家介绍一篇AAAI 2024中,由新加坡科技研究局(A*STAR)和新加坡南洋理工大学联合发表的时间序列分类工作,通过图感知对比学习改善多变量时间序列分类,取得了非常显著的效果提升。 图片 论文标题:Graph-Aware Contrasting...
-
NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]
国内外大模型汇总列表 中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...
-
AI绘画stability工具大全
Stability AI 公司的关于AI绘画工具集合,这家公司从Stable Diffusion商业出来,具有能浓厚社区文化,凡事研究AI绘画都会关注这家公司! Stability AI 的使命是让AI对所有人开放和有益。 本文基于Stable Dif...
-
【部署LLaMa到自己的Linux服务器】
部署LLaMa到自己的Linux服务器 一、官方方法(知道就好,具体操作用不上这个) 1、Llama2 项目获取 方法1:有git可以直接克隆到本地 方法2:直接下载 2、LLama2 项目部署 3、申请Llama2许可 4、下载模型权重...
-
AI 如何精准生成令人惊叹的代码流程图
大家好,我是木川 没有 AI 的时候,我们阅读完代码,然后根据自己的理解,手动通过 XMind 绘制思维导图,或者通过 draw.io 绘制流程图,至少需要 60 分钟 有了 AI,其实可以直接将代码转换为比较准确的代码可视化图形,省掉自己阅读代码的时...
-
AI作画工具 stable-diffusion-webui 一键安装工具(A1111-Web-UI-Installer)
安装 下载最新版本 确保你的 NVIDIA 显卡驱动程序是最新的(起码不能太老) 启动安装程序 在欢迎屏幕上单击下一步 在屏幕上,选择要安装的内容 如果你已经安装了 Python 3.10 和 Git,那么可以取消选中 如果你不知道这些是什么,就按默...
-
CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗?| DALL-E 3、Stable Diffusion等20+ 图像生成模型综述
随着科技飞速发展,CES(国际消费电子展)已然成为全球科技产业的风向标,每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会,不难发现其亮点纷呈,其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点,各大厂商纷纷展...
-
如何使用Stable Diffusion的ReActor换脸插件
ReActor插件是从roop插件分叉而来的一个更轻便、安装更简单的换脸插件。操作简单,非常容易上手,下面我们就介绍一下,如何将ReActor作为stable diffusion的插件进行安装和使用。 一:安装ReActor插件 项目地址:https:...
-
一文搞懂使用 Arthur Bench 进行 LLM 评估
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM 的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领...
-
【每周AI简讯】微软Copilot上线安卓和iOS应用
微软Copilot上线安卓和iOS应用 微软在其 Google Play 商店列表中将 Copilot 描述为:“Copilot 是微软的一款开创性聊天助手,由最新的 OpenAI 模型、GPT-4 和 DALL·E 3 提供支持。这些先进的人工智能技术...
-
Agent像人一样分工协作,还能“群聊”交换信息
智能体也要有“规范手册”! 一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增。 目前,这项研究在GitHub上已狂揽33.6k星,并在深度学习顶会ICLR 2024上被...
-
Github Copilot 功能介绍
Copilot 是一款由 GitHub 和 OpenAI 共同开发的编程工具,它基于人工智能技术,旨在帮助开发人员提高编码效率。Copilot 结合了 GitHub 的代码存储库和开源社区的力量,以及 OpenAI 的自然语言处理和机器学习能力,为开发人员...
-
AI 绘画神器 Stable Diffusion 基础教程
AI 绘画工具的选择与运用 1.工作场景下 AI 绘画工具的选择 目前文生图的主流 Al 绘画平台主要有三种: Midjourney、Stable Diffusion、DALL·E-2 2.如果要在实际工作场景中应用,我更推荐 Stable Dif...
-
Stable Diffusion保姆级安装教程
Stable Diffusion是一款强大的AI图像生成模型,被誉为最优秀的AI绘画工具之一,现在我们要与大家分享Stable Diffusion的本地部署教程,让你轻松体验! 0、系统要求 在开始之前,确保你的电脑硬件符合以下推荐配置: CPU:...
-
史上首个100%开源大模型重磅登场!破纪录公开代码/权重/数据集/训练全过程,AMD都能训
多年来,语言模型一直是自然语言处理(NLP)技术的核心,考虑到模型背后的巨大商业价值,最大最先进的模型的技术细节都是不公开的。 现在,真·完全开源的大模型来了! 来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员,联合发表了...
-
图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定
能不能有一种通用的图模型—— 它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐? 或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制? 你还真别说,被ICLR 2024接收为Spotlight的“One for All(OFA)...
-
Stable Diffusion汉化插件
今天为大家介绍Stable Diffusion的两种UI汉化包,一种是汉化包,就中文界面,方便大家对于繁杂的参数的模型的操作,一种是中英文对照界面,在中文提示下,同时显示英文,不但方便设置也同时学习了英文单词。就如下面这个界面: 好了不多说了,我们开...
-
AI绘画指南 stable diffusion webui (SD webui)如何设置与使用
根据自己最近的理解与实践,只能说是给后来的AI绘画作画者一点快速上手入门的参考吧。 主要是涉及 SD webui 界面介绍 参数含义及调整,txt2img 怎么设置特征点,img2img 怎么完善原始图像等内容。 stable diffusion w...
-
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相较之下,我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数,还包...
-
击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 个新模型,其中就包括更小且高效的 text-embedding-3-small 嵌入模型。 我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使...
-
Stable Diffusion - Prompts 提示词工程框架
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131544508 当前 Stable Diffusion 模型使用...
-
Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw
本文首发于公众号:机器感知 Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw SHViT: Single-Head Vision Transformer with Memory Ef...
-
【AIGC-图片生成视频系列-3】AI视频随心而动:MotionCtrl的相机运动控制和物体运动控制
目录 一. 项目简介 二. 主要贡献 三. 摘要 四. 实现方法和管线 五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...