-
rk3588使用npu加速运行whisper语音识别模型
rk3588运行whisper模型有三种方法:1.使用纯cpu运行原始pytorch模型;2.将whisper模型转成onnx格式,再转成rknn格式使用npu运行;3.利用npu提供的矩阵运算功能,结合cpu一起运行原始pytorch模型。方法1做不到实...
-
使用Copilot辅助编程:我如何减少加班并提高工作效率
当我聘用了一个高级工程师给我写代码,我再也不加班了! 很多医生朋友说写代码很难,学不会python。在这个AI时代,作为智慧的顶尖人类,你还在百度搜代码真的是out了。 学会站在巨人的肩膀上,让AI替你搬砖! Tina姐之前在朋友圈发了个视频,内容就...
-
搭建一个自己的MidJourney平台:开启你的赚钱之旅
搭建一个自己的MidJourney平台:开启你的赚钱之旅 在当今数字化时代,越来越多的人开始寻找在线赚钱的机会。无论你是一个技术爱好者,还是一个创业新手,搭建 MidJourney 并将其转化为一个盈利项目,都是一个绝佳的选择。本文将带你了解如何零代码搭...
-
Github Copilot - AI辅助编程工具的使用反馈和技巧分享
背景介绍 过去的两个月,我尝试使用Github Copilot作为前端开发和Javascript编程的辅助工具。下面分享一些相关的Github Copilot使用技巧。这并不是一个全面的Github Copilot使用指令介绍。关于完整和详细的指令介绍...
-
大模型剧本杀开源:6个Claude里藏一个凶手!刚上线服务器就被挤爆,免费免下载免注册
AI原生互动侦探游戏,刚上线就爆火,服务器一度挤爆。 免费、免下载、免注册、中文友好、浏览器运行… … 这么多buff叠在一起,是不是勾起了你的好奇心? 今天的主角AI Alibis,由两位外国游戏爱好者共同开发,并且作为参赛作品提交给了Anthropi...
-
Mistral AI 发布 Codestral-22B,精通 80+ 编程语言,22B 参数超越 70B Code Llama
前言 大型语言模型 (LLM 在代码生成领域展现出巨大的潜力,但现有的模型在支持的编程语言数量、生成速度和代码质量方面仍存在局限性。法国 AI 独角兽 Mistral AI 近期发布了其首款代码生成模型 Codestral-22B,宣称在多项指标上超越...
-
Stable-Diffusion 3 详细安装教程
文章目录 1、下载 ComfyUI 控制面板 1.1 如何打开ComfyUI 2、下载大模型 2.1 下载Stable-Diffusion 3 大模型 2.2 下载其它模型 3、下载 ComfyUI 汉化包 3.1 如何设置使用 4、亲身示...
-
Stable Diffusion 3 文本生成图像 在线体验 原理分析
前言 本文分享使用Stable Diffusion 3实现文本生成图像,可以通过在线网页中免费使用的,也有API等方式访问。 同时结合论文和开源代码进行分析,理解其原理。 Stable Diffusion 3是Stability AI开发的最新、最先...
-
一周SOTA:Meta 发布 Llama 3;Mistral AI 开源 Mixtral 8x22B;阿里开源代码模型CodeQwen1.5;面壁 MiniCPM 2.0 发布
文章目录 一周SOTA:Meta 发布 Llama 3;Mistral AI 开源 Mixtral 8x22B;阿里开源代码模型CodeQwen1.5;面壁 MiniCPM 2.0 发布 1.Meta 震撼发布 Llama 3,8B、70B模...
-
vim copilot插件安装使用
copilot简介 在使用不熟悉的开发语言或函数库进行开发工作时,虽然可以通过阅读开发文档或示例代码的方式学习开发,但这种方式学习成本较高、效率较低,且后续不一定会用上。 GitHub Copilot是一个由GitHub开发的机器学习工具,可以为开发者...
-
我用LLaMA大模型开发了一个聪明又温柔的智能客服机器人——她的名字叫“云云”
1、非常现实的问题 像绝大多数小型科技公司一样,作为一家中关村里的软件企业,我们的产品定位清晰、目标客户明确,在自己擅长的领域持续研发和耕耘,拥有了一定规模的用户群。 在公司发展的近10年时间里,我和我的同事共接待了近万名客户,这些客户有的购买了我们的...
-
LeCun新作:分层世界模型,数据驱动的人型机器人控制
有了大模型作为智能上的加持,人型机器人已然成为新的风口。 科幻电影中「安能辨我不是人」的机器人似乎已经越来越近了。 不过,要想像人类一样思考和行动,对于机器人,特别是人型机器人来说,仍是个艰巨的工程问题。 就拿简单的学走路来说,利用强化学习来训练可能会演...
-
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。 然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。 比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。 定位能力的缺失直接限制了多模态...
-
51-37 由浅入深理解 Stable Diffusion 3
2024年3月5日,Stability AI公开Stable Diffusion 3论文,Scaling Rectified Flow Transformers for High-Resolution Image Synthesis。公司像往常一样承诺后续...
-
UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。 StarC...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
清华系发布全新金融AI功夫量化 几秒完成金融数据分析
近日,国内AI创新企业功夫源科技推出了一款名为「功夫量化」的金融数据分析AI应用,标志着金融数据分析领域的一次重大突破。 「功夫量化」AI应用能够在PB级金融数据中以秒级速度进行精准的信息搜寻,为普通投资者提供了一款无需编程即可轻松进行数据分析的金融工具。...
-
北大开源最强aiXcoder-7B代码大模型 专为企业级软件开发场景设计
在当今科技快速发展的时代,AI代码生成技术正逐渐成为软件开发领域的热门话题。尽管AI在解决编程问题方面表现出色,但在真实的企业开发环境中,其应用似乎还不够理想。为了解决这一问题,aiXcoder团队推出了全新的开源代码大模型——aiXcoder-7B Ba...
-
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
近期,扩散模型凭借其出色的性能已超越 GAN 和自回归模型,成为生成式模型的主流选择。基于扩散模型的文本到图像生成模型(如 SD、SDXL、Midjourney 和 Imagen)展现了生成高质量图像的惊人能力。通常,这些模型在特定分辨率下进行训练,以确...
-
GitHub突破1000星!上交、清华开源个性化联邦学习算法库PFLlib
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 我们在 GitHub 上开源了一个个性化联邦学习算法仓库(PFLlib),目前已经获得 1K+ 个 Star 和 200+ 个 Fork...
-
CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ CVPR 2024最终录用结果公布了! 刚刚,CVPR官方发文称,今年共提交了11532份有效论文,2719篇论文被接收,录用率为23...
-
HOW - Copilot 使用技巧
目录 一、介绍 二、定位:开发者的高水平结对编程助手 三、使用场景 四、常见使用方式 运维团队 数据与算法团队 开发和测试团队 五、对效率的提升 六、常见问题 一、介绍...
-
生成式AI指南体验入口 awesome-generative-ai-guide项目地址入口
awesome-generative-ai-guide是一个集中存放生成式人工智能相关资源的中心,包括每月最新研究论文、面试题库、课程材料、代码笔记本等。内容定期更新,旨在让开发者及从业人员能够及时跟进最新进展,提高生产力。主要资源包括论文摘要、面试问题分...
-
昇思MindSpore 2.3全新发布 | 昇思人工智能框架峰会2024圆满举办
北京时间3月22日消息,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推动根技术持续创新,共建人...
-
深度估计SOTA!自动驾驶单目与环视深度的自适应融合
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 多视图深度估计在各种基准测试中都取得了较高性能。然而,目前几乎所有的多视图系统都依赖于给定的理想相机姿态,而这在许多现实世界的场景中是不可用的,例如自动驾驶。本工作提出了一...
-
巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数
传统的时空预测模型通常需要大量数据支持才能取得良好效果。 然而,由于城市发展水平不均衡和数据收集政策的差异,许多城市和地区的时空数据(如交通和人群流动数据)受到了限制。在这种情况下,模型在数据稀缺情况下的可迁移性变得尤为重要。 现有研究主要利用数据丰富的...
-
开源问卷调查CMS采集插件的探讨与应用
随着互联网技术的迅猛发展,各类内容管理系统(CMS)在网站建设与应用中发挥着日益重要的作用。尤其是当问卷调查成为信息收集与数据分析的重要手段时,如何在现有的CMS框架中高效地集成问卷调查功能成为开发者关注的焦点。本文将对开源问卷调查CMS采集插件进行深入探...
-
【ICCV】AIGC时代下的SOTA人脸表征提取器TransFace,FaceChain团队出品
一、论文 本文介绍被计算机视觉顶级国际会议ICCV 2023接收的论文 "TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Persp...
-
在 PyCharm 中使用 Copilot
GitHub Copilot 由 OpenAI Codex 提供支持,可帮助用户在编辑器中实时工作。 它使用强大的 GPT-3 模型版本,该模型在大量开源代码上进行训练。 此外,GitHub Copilot 可在不同的 IDE(集成开发环境)上使...
-
研究人员开发AI攻击方法BEAST:可在一分钟内绕过LLM防护栏
研究人员在美国马里兰大学成功开发了一种高效的方法,可以在一分钟内诱导大型语言模型(LLM)产生有害反应,他们将这一技术命名为BEAST(BEAm Search-based adversarial aTtack 。BEAST技术利用Nvidia RTX A6...
-
【专题速递】音频生成、TTS和AIGC在音乐上的运用
// AIGC的发展为音频带来了什么?AIGC如何赋能音乐创作?如何识别虚假音频?TTS可以在哪种场景下解决特定问题?7月29日LiveVideoStackCon2023上海站音频新体验专场,为您解答。 音频新体验 随着多媒...
-
聊聊视觉惯性里程计的IMU预积分模型
为什么工程实践中我们使用视觉与IMU融合的解决方案即视觉惯性里程计(VIO)来估计运动而不是简单地使用视觉里程计(VO)。视觉惯性里程计的传感器主要包括相机和惯性测量单元(IMU)两种传感器各有优缺点,VIO的优势就在于IMU与相机的互补性。 视觉传感器...
-
为什么人工智能应该开源?
在当今快速发展的数字时代,人工智能几乎处于所有行业革命性创新的前沿。从医疗保健、教育到娱乐,人工智能的变革性影响是显而易见的。 什么是开源人工智能? 开源人工智能是人工智能软件和工具,其源代码开放并向公众开放。开发人员、研究人员和其他感兴趣的各方可以访...
-
近期关于AIGC方面的学习笔记和思路整理
LLM 对于LLM,我现在重点关注在这几个方面: 开源且可私有化部署的代码生成模型: 因为大部分软件企业对于安全都很重视,文档、数据、代码一般都会尽量避免被泄露。所以很难使用类似Copilot或者OpenAI的Bito这种需要连到互联网上的服务。如果...
-
万元预算打造高质量13B私有模型,Colossal-AI LLaMA-2 开源方案再升级
几个月前,Colossal-AI 团队仅利用8.5B token数据、15小时、数千元的训练成本,成功构建了性能卓越的中文LLaMA-2 7B 版本模型,在多个评测榜单性能优越。 在原有训练方案的基础上,Colossal-AI 团队再次迭代,并通过构建更...
-
LLM自动进行数据分析-论文《Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow》笔记
文章目录 概要 接口设计Interface Design Explore Data by Self-Request Interface definition Interface Merging Interface Implementation...
-
【ScienceAI Weekly】AI+生物凝聚物初创公司宣布裁员15%;科技部明确科研中的AIGC红线;讯飞医疗递表港交所
AI for Science 的新成果、新动态、新视角—— 全球首家将生物分子凝聚体应用于药物发现的公司,宣布裁减 18 个职位 谷歌 DeepMind 发布 AlphaGeometry Evaxion Biotech 宣布用 AI 开发定制癌症疫苗...
-
浅析GitHub Copilot
技术实现与原理 基于Transformer的模型:Copilot的核心是基于GPT-3(以及后续更先进的版本)架构训练的大型语言模型,该模型在海量的开源代码库上进行了微调。通过学习数十亿行公开可用的源代码,它能够理解编程语法、语义和上下文,并生成结构良...
-
Github Copilot 全方位上手通关指南
从上年 AI 大火开始,其实安仔就一直在使用 Github Copilot 的功能了,那时候它还是 Beta 版,可以不用钱薅羊毛,而且它帮安仔做一些重复性的代码工作很适合,可以默默地帮安仔增加摸鱼时间。 但随着最近 Github Copilot 用的...
-
抛弃编码器-解码器架构,用扩散模型做边缘检测效果更好,国防科大提出DiffusionEdge
现有的深度边缘检测网络通常基于包含了上下采样模块的编码器 - 解码器架构,以更好的提取多层次的特征,但这也限制了网络输出既准又细的边缘检测结果。 针对这一问题,一篇 AAAI 2024 上的论文给出了新的解决方案。 论文题目:DiffusionEd...
-
7B开源数学模型干翻千亿GPT-4,中国团队出品
7B开源模型,数学能力超过了千亿规模的GPT-4! 它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。 无需借助任何外部工具,它就能在竞赛水平的MATH数据集上达到51.7%的准确率。 在开源模型中,它第一个在该数据集上...
-
AIGC智能编程如何适应并推动开源项目的发展?
AIGC智能编程如何适应并推动开源项目的发展? 开源项目在软件行业中具有重要的地位,它们为开发人员提供了协作和共享代码的机会。AIGC智能编程作为一种创新的编程方法,能够适应和推动开源项目的发展,为开发人员提供更高效、更智能的编程体验。 1. AI...
-
图感知对比学习提升多变量时间序列分类效果
今天给大家介绍一篇AAAI 2024中,由新加坡科技研究局(A*STAR)和新加坡南洋理工大学联合发表的时间序列分类工作,通过图感知对比学习改善多变量时间序列分类,取得了非常显著的效果提升。 图片 论文标题:Graph-Aware Contrasting...
-
开源版GPTs人人免费用!Hugging Face发布定制个人助手,点两下轻松创建
去年,OpenAI发布GPTs之后,短短几个月,全网诞生了300万+个GPT。 而现在,「开源低配版」的GPTs来了! 最近,世界最大的开源社区Hugging Face推出了开源、可定制的AI 助手——Hugging Chat Assistants。 图...
-
AIGC的狂欢,代码安全的隐患。
大家好,这里是安势信息。 小故事 【小开】与【小A】本是一对兄弟,小开年纪大小A几岁。小开是个好哥哥,早早的担负起哥哥的责任,有什么好的都给了小A,比如什么GAN算法、Stable Diffusion,CLIP模型、Transformer等等,小A...
-
程序员的利器:在VSCode中安装Copilot
导语: 作为程序员,我们时常面临着代码编写的挑战和重复劳动。幸运的是,现代技术为我们提供了许多工具来提高效率。其中,VsCode上的Copilot插件就是一个强大的助手,它能够自动生成代码提示和建议,极大地减少了编码过程中的繁琐工作。本文将向您介绍如何安装...
-
AI 绘画平台难开发,难变现?试试 Stable Diffusion API Serverless 版解决方案
作者:王佳、江昱、筱姜 Stable Diffusion 模型,已经成为 AI 行业从传统深度学习时代走向 AIGC 时代的标志性里程碑。越来越多的开发者借助 stable-diffusion-webui(以下简称 SDWebUI)能力进行 AI 绘画领...
-
编程能力超GPT-4,羊驼代码版“超大杯”来了,小扎还亲自剧透Llama3
羊驼家族的“最强开源代码模型”,迎来了它的“超大杯”—— 就在今天凌晨,Meta宣布推出Code Llama的70B版本。 图片 在HumanEval测试中,Code Llama-70B的表现在开源代码模型中位列第一,甚至超越了GPT-4。 此次发布的超...
-
无缝衔接Stable Diffusion,一张照片几秒钟就能生成个性化图片-InstantID
最近一段时间基于扩散模型的图像处理方法遍地开花,接下来为大家介绍一种风格化图像的方法InstantID,可以通过仅有一张人脸照片,几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同,InstantID只需一张图像...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...