-
Llama中文大模型
关于Llama中文大模型 欢迎来到Llama中文大模型:已经基于大规模中文数据,从预训练开始对Llama2模型进行中文能力的持续迭代升级。 Llama中文大模型 :https://github.com/LlamaFamily/Llama-Chine...
-
Stable Diffusion WebUI常用Tag收集
捆绑(nsfw *可以直接加人物lora Masterpiece, high quality, beautiful wallpaper, 16k, animation, illustration, positive perspective, perf...
-
机器学习中的十种非线性降维技术对比总结
降维意味着我们在不丢失太多信息的情况下减少数据集中的特征数量,降维算法属于无监督学习的范畴,用未标记的数据训练算法。 尽管降维方法种类繁多,但它们都可以归为两大类:线性和非线性。 线性方法将数据从高维空间线性投影到低维空间(因此称为线性投影 。例子包括...
-
基于LLaVA开源模型打造视频聊天助手
简介 大型语言模型已经证明自己是一项革命性的技术。目前,人们已经开发出了许多基于大型语言模型功能的应用程序,而且预计很快还会有更多的应用程序问世。大型语言模型最有趣的应用之一是将其部署为智能助手,它们能够帮助人类用户完成各种任务。 人们已经能够通过指令微...
-
文心一言插件开发(第三篇
目录 1. 从0到1开发自己的插件: 1.1 插件描述文件(ai-plugin.json) 1.2 服务描述文件(openapi.yaml) 1.2.1 数据类型: 1.2.1 OpenAPI 对象: 1.3 示例描述文件(example...
-
20240127在ubuntu20.04.6下配置whisper
20240131在ubuntu20.04.6下配置whisper 2024/1/31 15:48 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的驱动...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...
-
如何使用OpenAI的whisper
文章目录 一、安装ffmpeg 二、安装torch等相关组件 三、安装Whisper 四、下载模型 五、测试效果 六、cpu与gpu解码的耗时对比 参考文献 一、安装ffmpeg yum localinstall --nogpgc...
-
深入探索 Stable Diffusion:AI图像创新的新纪元
深入探索 Stable Diffusion:AI图像创新的新纪元 介绍 Stable Diffusion 的核心功能和应用场景 Stable Diffusion 架构解析 深入 Stable Diffusion 的关键组件 变分自编码器(VA...
-
三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法
优化语义分割模型常用的损失有Soft Jaccard损失,Soft Dice损失和Soft Tversky损失,但它们都和软标签不兼容,所以无法支持一些重要的训练技术(例如标签平滑,知识蒸馏,半监督学习,多标注员等)。 另一方面,语义分割常用的评价指标...
-
微软为新闻编辑行业推出 AI 辅助项目:记者可参加免费课程,学习如何最佳使用 AI
2 月 6 日消息,微软当地时间 5 日发布新闻稿宣布与多家新闻机构展开多项基于生成式 AI 的合作。微软表示,其使命是确保新闻编辑室在今年和未来拥有创新。 通过这次官宣的项目,微软将帮助新闻机构识别、完善使用 AI 进行新闻采编、业务实践的程序及政...
-
Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw
本文首发于公众号:机器感知 Single-Head ViT;Faster Whisper;Transformer KF;Pick-and-Draw SHViT: Single-Head Vision Transformer with Memory Ef...
-
【书籍】强化学习第二版(英文版电子版下载、github源码)-附copilot翻译的中英文目录...
Python代码:https://github.com/ShangtongZhang/reinforcement-learning-an-introduction 英文原版书籍下载:http://incompleteideas.net/bo...
-
在Meteor Lake上测试基于Stable Diffusion的AI应用
上个月刚刚推出的英特尔新一代Meteor Lake CPU,预示着AI PC的新时代到来。AI PC可以不依赖服务器直接在PC端处理AI推理工作负载,例如生成图像或转录音频。这些芯片的正式名称为Intel Core Ultra处理器,是首款配备专门用于处理...
-
.Net接入AzureOpenAI、OpenAI、通义千问、智谱AI、讯飞星火、文心一言大语言模型。
前言 现在在网上搜索.NET接入大模型的帖子很少,有些官方案例只提供java和python的SDK,所以有了这篇.Net的接入大模型文章,目前仅实现对话模型的调用。 这里仅举例通义千问,其他模型实现可以参考Gi他Hub 对您有帮助的话帮忙点个star...
-
扎克伯格分红7亿刀,Meta股价大涨14%,开源大计成了?
伴随着 Meta 的股价周四盘后上涨近 14%,升至历史新高,这家公司宣布了有史以来的首次股息派发。 最近一次财报电话会议公布内容显示,Meta 公布的 2023 全年营收为 1349 亿美元,较 2022 年增长 16%;净利润为 391 亿美元,同比...
-
【Stable Diffusion】通过ControlNet修复手臂
ControlNet用处 ControlNet是一个用于机器人控制的高度模块化的、灵活的开源框架,它支持各种传感器、执行器和通信协议。ControlNet可以用于各种应用领域,包括但不限于: 工业自动化:ControlNet可以用于工业自动化系统...
-
一个月30万片H100,英伟达欲找英特尔造芯?只因CoWos产能太低
台积电产能不够,逼得英伟达都去找英特尔造芯片了? 台积电在2023年年中承认,其先进芯片封装技术CoWoS(Chip on Wafer on Substrate)的需求已经超出了他们的生产能力。 另一方面,被称为「人造黄金」的英伟达AI芯片在市场上供不应...
-
Ai作画区域控制的几种方法
背景 距上次发文章,又过去好久。这期分享给大家带来的是Ai作画的图结构控制几种方法。现在大家用AI作画大部分情况是直接使用AI单图生成能力,其实并不太会取考虑构图,也不太会考虑到大图的图结构这件事。其实构图这件事是一件很综合复杂的事情,很难去定义什么样的...
-
【AI】aarch64 kylin llama.cpp CUDA 适配 Chinese-LLaMA-Alpaca-2 启用 Tesla P4 8G GPU支持【失败】
GPU GPU架构信息 Pascal架构: compute_60: GeForce GTX 10xx系列、TITAN Xp, Tesla P100等 compute_61: Quadro GP100, Tesla P40等 co...
-
Stable Diffusion——外挂VAE模型
stablediffusion种的vae作用是什么? Stable Diffusion 是一种基于变分自编码器(VAE)的深度学习模型,其作用主要是用于文本生成图像。 具体来说,VAE是一种生成模型,可以学习到数据的潜在表示空间,并将其用于生成...
-
【思路合集】talking head generation+stable diffusion
1 以DiffusionVideoEditing为baseline: 改进方向 针对于自回归训练方式可能导致的漂移问题: 训练时,在前一帧上引入小量的面部扭曲,模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。 在像VoxCeleb或L...
-
GitHub Copilot使用方法
大家好,我是升仔 引言 GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它通过理解代码的上下文,自动提供代码补全建议,大大提高编程效率。接下来,我将介绍如何使用GitHub Copilot,并提供一...
-
基于Rust的Zed编辑器已开源,内置对OpenAI和GitHub Copilot的支持
作者丨Tim Anderson 编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Zed 编辑器项目(目前仍处于预发布阶段)现已在 AGPL、GPL 和 Apache 许可下开源。该编辑器以其高性能和多种AI辅助选择为特色,但目前仍...
-
Kore.ai获得1.5亿美元用于开发对话式AI平台 英伟达也参投
Kore.ai 获得了 1.5 亿美元的投资,用于开发其对话/生成型人工智能平台技术。这轮融资于周二(1 月 30 日)宣布,由 FTV Capital 领投,芯片制造商英伟达也参与了投资。 这家总部位于佛罗里达州奥兰多的公司表示,它将利用这笔资金扩大其...
-
南大周志华团队8年力作!「学件」系统解决机器学习复用难题,「模型融合」涌现科研新范式
HuggingFace是目前最火热的机器学习开源社区,汇集30万个不同的机器学习模型,有超过10万个应用可供用户访问和使用。 如果HuggingFace上这30万个模型,可以自由组合,共同完成新的学习任务,那会是一种什么样的画面? 其实在HuggingF...
-
近200+自动驾驶数据集全面调研!一览如何数据闭环全流程
写在前面&个人理解 自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展,并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集,但要么集中在有限数量的数据集上,要么缺乏对数据集特征的详细调查...
-
Semron筹集790万美元,用于移动设备的3D封装AI芯片、效率提升20倍
德国公司Semron最近成功融资了790万美元(730万欧元),旨在通过先进的3D封装技术推动移动设备上的AI芯片效率提升。总部位于德累斯顿的Semron表示,他们的目标是在移动设备上设立新的AI芯片标准,以满足行业不断发展的需求。 图源备注:图片由AI...
-
探索星辰大海:成为AIGC大模型领域的精英 - 近屿智能OJAC深度训练营招募中!
朋友,面对AIGC这股新的AIGC技术革命浪潮,您还在旁观吗? 近屿智能OJAC第六期AIGC星辰大海:大模型工程师和产品专家线上训练营,正在寻找像您这样有梦想、有热情的学员!OJAC的AIGC星辰大海第六期训练营,一个为您量身打造的AI大模型学习之...
-
第三十二章:ChatGPT与AIGC在物联网领域的应用
1.背景介绍 物联网(Internet of Things,IoT 是指通过互联网将物体和设备连接起来,实现数据的传输和共享。物联网技术已经广泛应用于各个领域,如智能家居、智能城市、智能制造、智能农业等。随着数据量的增加和计算能力的提高,人工智能...
-
中国AIGC广告营销产业全景报告:五大变革四大影响,生成式AI让只为「一个人」打造广告成为可能...
量子位智库 发自 凹非寺量子位 | 公众号 QbitAI 在互联网流量红利消退的当下,广告营销产业进入存量竞争。 TikTok开始用生成式AI来提供广告脚本,Snapchat开始用聊天机器人来推个性化广告,百度营销重构了一系列全新的AI Na...
-
异常值检测方法比较——基于美国职业棒球联盟2023赛季击球数据
译者 | 朱先忠 审校 | 重楼 异常值检测是一种无监督的机器学习任务,用于识别给定数据集中的异常(即“异常观测”)。在大量现实世界中,当我们的可用数据集已经被异常“污染”时,异常值检测任务对于整个机器学习环节来说是非常有帮助的。当前,开源框架Sciki...
-
迈向分割的大一统!OMG-Seg:一个模型搞定所有分割任务
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人思考 图像分割已经从单任务分割走到了语义分割、实例分割、全景分割三种分割任务的统一;大模型以及多模态的发展又带来了文本和图像统一,使得跨模态端到端成为可能;追求更高级、更全面...
-
世界首款电驱机器人练「空翻」,单挑波士顿动力Atlas!还会煮咖啡拉花
2017年,波士顿动力人形机器人Atlas会空翻那一幕,惊艳了全世界。 图片 而今天,挑战波士顿动力Atlas的全新人形机器人诞生了! 虽然还未装上上半身,仅有两足的机器人一个翻转后,稳稳地立在那里,不输Atlas。 值得一提的是,这是初创公司Magi...
-
LCM-LoRA:通用stable diffusion 加速模块!2023.11.13顶会论文速递!
整理:AI算法与图像处理 欢迎关注公众号 AI算法与图像处理,获取更多干货: 推荐 微信交流群现已有2000+从业人员交流群,欢迎进群交流学习,微信:nvshenj125 B站最新成果demo分享地址:https://s...
-
AIGC: 关于ChatGPT中实现一个聊天机器人
规划一个聊天机器人 智能化完全于依托于GPT, 而产品化是我们需要考虑的事情 比如,如何去构建一个聊天机器人 聊天机器人它的处理逻辑其实非常的清晰 我们输入问题调用 GPT 然后,GPT 给我们生成回答就可以了 需要注意的是,聊天机器人不...
-
AIGC内容分享(十):中国AIGC广告营销产业全景报告
目录 前言 大模型时代下的广告营销 生成式AI成为破局关键 生成式AI广告营销领域应用 AIGC广告营销五大变革 变革一:产业链变革 变革二:工作流程变革 变革三:生产场景变革 变革四:投放效果变革 变革五:业态与格局变革 AIGC广...
-
AI搜索Perplexity来了,谷歌搜索真正有了对手
要说在互联网世界中什么才是“王冠顶上的明珠”,或许就非搜索引擎莫属了,毕竟在太平洋两岸也分别造就了百度和谷歌这两大巨头的基业长青。如此美妙的生意自然从来都不缺乏挑战者,国内市场有360、搜狗,海外也有Bing、雅虎,以及DuckDuckGo。而随着AI大模...
-
【多模态】14、Segment Anything | Meta 推出超强悍可分割一切的模型 SAM
文章目录 一、Intruduction 二、Segment Anything Task 三、Segment Anything Model 四、Segment Anything Data Engine 五、Segment Anything Dat...
-
Stable Diffusion背后原理(Latent Diffusion Models)
前言 2023年第一篇博客,大家新年好呀~ 这次来关注一下Stable Diffusion背后的原理,即 High-Resolution Image Synthesis with Latent Diffusion Models 这篇论文。 之前关注的...
-
最近读的AIGC相关论文思路解读
AIGC之SD可控生成论文阅读记录 提示:本博客是作者本人最近对AIGC领域相关论文调研后,临时记录所用,所有观点都是来自作者本人局限理解,以及个人思考,不代表对。如果你也正好看过相关文章,发现作者的想法和思路有问题,欢迎评论区留言指正! 既然是论...
-
四种通过LLM进行文本知识图谱的构建方法对比介绍
我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知识图谱。但是对于知识图谱的创建是一个很复杂的过程,比如需要对属性增加限制,创建符合特定主题/模式的图谱,并且有时文档非常大,无法作为单个提示处理,所以在切分后的提示中创建的图谱需要前后一致。...
-
文心一言,通营销之学,成一家之言,百度人工智能AI大数据模型文心一言Python3.10接入
“文心”取自《文心雕龙》一书的开篇,作者刘勰在书中引述了一个古代典故:春秋时期,鲁国有一位名叫孔文子的大夫,他在学问上非常有造诣,但是他的儿子却不学无术,孔文子非常痛心。 一天,孔文子在山上遇到了一位神仙,神仙告诉他:“你的儿子之所以不学无术,是因为你没...
-
Java调用Midjourney进行AI画图原生版抓包实现支持中文
用途介绍 Midjourney是一个目前优秀的AI画图工具,不挂梯无法直接访问 本代码主要用于搭建镜像站使用 适合人群 本代码不适合新手,建议使用过okhttp、且具有二开能力的同学使用~ 实现原理 通过调用发送信息接口发送请求,通过轮询房间消...
-
20源代码模型的数据增强方法:克隆检测、缺陷检测和修复、代码摘要、代码搜索、代码补全、代码翻译、代码问答、问题分类、方法名称预测和类型预测对论文进行分组【网安AIGC专题11.15】
Data Augmentation Approaches for Source Code Models: A Survey 写在最前面 对nlp领域其他方向的启发 英文版: 论文名片 论文总结 一个有意思的表 1.背景Background...
-
AIGC内容分享(十二):AIGC探索之旅AIGC探索之旅
目录 前言 引言:AI时代,未来已来 AIGC简介与发展历程 早期萌芽阶段(1950s-1990s) 沉淀积累阶段(1990s-2010s) 快速发展阶段(2010s至今) 大模型与AIGC的关联 大模型概述 大模型的定义和特点 典型大...
-
大型语言模型检索增强生成利器——向量搜索引擎
译者 | 朱先忠 审校 | 重楼 简介 随着大型语言模型(LLM)席卷全球,向量搜索引擎也紧随其后。同时,向量数据库也构成大型语言模型长期记忆系统的基础。 通过有效的算法找到相关信息并使其作为上下文传递给语言模型,向量搜索引擎可以提供超出训练截止值的最...
-
不知道AIGC是什么?近屿智能OJAC第六期AIGC深度训练营,带您从入门到精通!
想赶上AIGC技术革命这波红利,赚取更多收益的朋友,现在正是大好的时机! 近屿智能OJAC的“AIGC星辰大海”第六期训练营正火热招募中!上千名学员已在此实现了职业的转型和飞跃,甚至有的学员通过学习AIGC大模型课程成功搭建出了自己的AI产品,并且成...
-
AI视野:智谱AI发布大模型GLM-4;腾讯发布PhotoMaker;GPT Store现多款违规AI女友;Deepfake音视频检测技术亮相CES
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📈💻💡大模型动态 智谱AI发布大...
-
开源语音超分辨率AI模型Resemble Enhance 可有效去除噪音杂音
Resemble Enhance是一款令人印象深刻的语音处理技术,专为将嘈杂的音频转换为清晰有力的语音而设计。该模型不仅能够去除音频中的各种噪声和杂音,还能够恢复音频失真并扩展音频带宽,使得原本的声音听起来更加清晰和自然。 项目地址:https://gi...