-
Meta提出全新注意力机制S2A 大模型准确率提升至80.3%
在2023科技领域,大语言模型(LLM)的应用日益广泛,但其在回答问题时存在的问题引起了关注。Meta团队提出的新注意力机制S2A通过解决LLM容易受到上下文虚假相关性的问题,显著提升了模型的准确性和客观性。这一机制的提出得到了深度学习领域的重要人物LeC...
-
一个提示,让Llama 2准确率飙至80.3%?Meta提出全新注意力机制S2A,大幅降低模型幻觉
2023的科技界,可以说是被大模型抢尽了风头(虚假的室温超导除外)。 我们经历了和LLM对话,见证了它们逐渐进入各个领域,甚至开始感受到威胁。 这一切,仅仅发生在一年之内。 当然了,基于大语言模型的原理,它诞生之时就有的一些毛病到现在也没有完全改正。 比...
-
Kumo.AI推出全新预测性AI平台 引入了类似SQL的预测性查询语言
近年来,技术的快速发展已经改变了企业的业务模式,人工智能成为全球范围内的核心讨论话题。在这一背景下,Kumo.AI宣布推出了一款全新的预测性AI平台,引入了类似SQL的预测性查询语言。相较于生成式AI,预测性AI更专注于基于当前数据预测未来趋势,能够处理更...
-
AWS语音转文本服务推出生成式AI技术 支持100种语言
亚马逊的 AWS 公司宣布,其语音转文本服务 Amazon Transcribe 现在采用生成式人工智能技术,能够识别并转录来自100种语言的语音,相较于2022年底的79种语言有了显著的提升。据AWS称,Transcribe通过对超过100种语言的数百万...
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接:https...
-
谷歌向印度BharatGPT投资400万美元 支持130多种语言
印度初创公司CoRover.ai近日成为Google重点投资对象,计划获得400万美元的资金支持。CoRover.ai是印度的人工智能工作室,推出了基于大型语言模型(LLM)的人工智能解决方案BharatGPT。这一举措被认为是印度在人工智能领域挑战Ope...
-
LLMLingua:集成LlamaIndex,对提示进行压缩,提供大语言模型的高效推理
大型语言模型(llm 的出现刺激了多个领域的创新。但是在思维链(CoT 提示和情境学习(ICL 等策略的驱动下,提示的复杂性不断增加,这给计算带来了挑战。这些冗长的提示需要大量的资源来进行推理,因此需要高效的解决方案,本文将介绍LLMLingua与专有的...
-
更像人脑的新型注意力机制,Meta让大模型自动屏蔽任务无关信息,准确率提高27%
关于大模型注意力机制,Meta又有了一项新研究。 通过调整模型注意力,屏蔽无关信息的干扰,新的机制让大模型准确率进一步提升。 而且这种机制不需要微调或训练,只靠Prompt就能让大模型的准确率上升27%。 作者把这种注意力机制命名为“System 2...
-
CardanoGPT 宣布 Girolamo AI 聊天机器人 Beta 版发布,将 AI 融入区块链技术
据一份新闻稿称,CardanoGPT 宣布了其 AI 驱动聊天机器人 Girolamo 的 Beta 版发布,这标志着该公司将人工智能(AI)与区块链技术结合的重要一步。 Girolamo 得名于意大利著名数学家 Girolamo Cardano,这一发...
-
如何使用GPTQ量化使LLM更轻
译者 | 李睿 审校 | 重楼 大型语言模型(LLM 应用的一大挑战是其耗费巨大的内存和计算需求,通常需要数十GB的GPU内存。这使得它们不仅昂贵而且难以运行。 为了缓解这些问题,研究人员开发了几种LLM压缩技术,其中包括“量化”。量化通过改变参数的存...
-
Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记
文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...
-
南开&山大&北理工团队开发trRosettaRNA:利用Transformer网络自动预测RNA 3D结构
RNA 3D 结构预测是一个长期存在的挑战。 受最近蛋白质结构预测领域突破的启发,南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA,这是一种基于深度学习的自动化 RNA 3D 结构预测方法。 trRosettaRNA 流程包括...
-
六个常用的聚类评价指标
评估聚类结果的有效性,即聚类评估或验证,对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类,还可以用来确定哪种聚类算法最适合特定的数据集和任务,并调优这些算法的超参数(例如k-means中的聚类数量,或DBSCAN中的密度参数 ...
-
「GPT-4只是在压缩数据」,马毅团队造出白盒Transformer,可解释的大模型要来了吗?
RNA3D 结构预测是一个长期存在的挑战。 受最近蛋白质结构预测领域突破的启发,南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA,这是一种基于深度学习的自动化 RNA3D 结构预测方法。 trRosettaRNA 流程包括两个主...
-
AI 绘画Stable Diffusion 研究(十五)SD Embedding详解
大家好,我是风雨无阻。 本期内容: Embedding是什么? Embedding有什么作用? Embedding如何下载安装? 如何使用Embedding? 大家还记得 AI 绘画Stable Diffusion 研究(七) 一文读懂 Stabl...
-
音频质量评估方法浅析
Part 01 评价方法 当涉及音频质量评价时,我们可以从主观评价和客观评价两个角度展开,以全面了解音频质量的好坏。这两种评价方法各自涉及不同的评估方式和应用场景,专家可以根据业务特点选取其中的一种或者多种评价方法结合的形式来评价业务音频质量。 主观评...
-
人类考92分的题,GPT-4只能考15分:测试一升级,大模型全都现原形了
AutoGPT 的得分也凉凉。 GPT-4自诞生以来一直是位「优等生」,在各种考试(基准)中都能得高分。但现在,它在一份新的测试中只拿到了15分,而人类能拿92。 这套名叫「GAIA」的测试题由来自 Meta-FAIR、Meta-GenAI、Hugging...
-
【腾讯云 HAI域探秘】——Stable Diffusion预装环境生成AIGC图片——必会技能【微调】
目录 Stable Diffusion基本使用方法 学术加速测试 配置中文插件 Prompt与Negative prompt 采样器说明 人像生成 水光效果 微调的使用 图像生成种子/seed使用 附加/Extra 微调实例测试 图...
-
AI视野:ElevenLabs发布“语音转语音”;realme GT5Pro 12月7日发布;Claude2.1被指严重虚标;清华大学提出全新加速训练大模型方法SoT
???AI应用 ElevenLabs发布“语音转语音” ElevenLabs的语音生成式AI平台发布了“语音转语音”功能,用户可上传语音并自动转换为不同音色,实现声音的自由切换,为用户带来全新的语音生成体验。 免费体验地址:https://elevenl...
-
最新Claude 200K严重「虚标」?大神壕掷1016美元实测,90K后性能急剧下降
OpenAI正忙着政变的时候,他们在硅谷最大的竞争对手Anthropic,则悄悄地搞了个大新闻——发布了支持200K上下文的Claude 2.1。 看得出来,Claude 2.1最大的升级就是将本就很强大的100K上下文能力,又提升了一倍! 200K的...
-
Amazon CodeWhisperer——从此编程变的简单起来
文章目录 前言 支持更多的idea 安装CodeWhisperer PyCharm安装 总结 前言 在当今数字化时代,编程已成为一项至关重要的技能。从软件开发到数据分析,从人工智能到云计算,编程的应用范围越来越广泛。然而,对于许多...
-
这项AI研究引入 Atom:一种低位量化技术,可实现高效、准确LLM)服务
大型语言模型(LLM)是人工智能领域最新的引入,已经席卷全球。这些模型以其令人难以置信的能力,被人们广泛使用,无论是研究人员、科学家还是学生。凭借其仿人潜力回答问题、生成内容、概括文本、完成代码等方面,这些模型已经走过了很长的路程。 LLM 在情感分析、智...
-
实测:GPT-3.5、GPT-4、Newbing和文心一言,你该怎么选?
在当今人工智能领域,自然语言处理技术已取得了飞速发展。作为用户,我们希望了解并选择最适合自己需求的AI工具。本文将从专业角度,对比评测四款热门软件:GPT-3.5、GPT-4、Newbing、文心一言,为您提供它们各自的优势场景,助您更好地运用这些工具。...
-
牛津大学AI研究员发出警告:大语言模型对科学真相构成风险
在最新的一篇研究中,牛津大学互联网研究所的人工智能研究员发出了对大语言模型(LLMs)对科学真相构成威胁的警告。由Brent Mittelstadt、Chris Russell和Sandra Wachter等研究员在《自然人类行为》期刊上发表的论文中,他们...
-
Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型
内容来源:@xiaohuggg Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型 该模型是由Hugging Face团队开发,它在Whisper核心功能的基础上进行了优化和简化,体积缩小了50%。速度提高了6倍。并...
-
【stable diffusion】保姆级入门课程06-Stable diffusion(SD)图生图-上传蒙版及批量处理的用法
目录 0.本章素材 1.什么是上传蒙版 1.1.注意点 1.2.提示词部份 2.批量处理 3.涂鸦、局部重绘、涂鸦蒙版、上传蒙版 4.结语 0.本章素材 案例图 链接:https://pan.quark.cn/s/3a64e6...
-
智慧城市的发展:废物管理和空气质量监测
通过废物管理和空气质量监测方面的智慧城市进步,探索城市生活的未来。 “智慧城市”的概念已经成为城市规划和发展的一种创新方法,体现了一系列旨在提高生活质量、服务效率和可持续性的战略。这些战略包括智能废物管理和空气质量监测系统,它们采用先进技术优化资源利用...
-
OpenAI新模型曝重大飞跃:AGI雏形或威胁人类,也成Altman被解雇导火索!
Sam Alman被解雇,又曝出最新内幕! 据路透社报道,就在他被解雇的前四天,OpenAI内部的研究员曾向董事会发了一封警告信,称发现了一个可能威胁人类的强大人工智能。 知情人士表示,这封此前从未报道过的信,也是董事会最终罢免Altman的导火索之一。...
-
在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本
您是否厌倦了手动转录数小时的录音?您想节省时间并提高工作效率吗?然后,您会很高兴听到 OpenAI 用于语音到文本转换的新 Whisper API!借助这项尖端的 AI 技术,您现在可以在 Python 程序中轻松地将音频文件转换为文本。让我们在下面...
-
CART算法解密:从原理到Python实现
本文深入探讨了CART(分类与回归树)算法的核心原理、实现方法以及应用场景。文章首先介绍了决策树的基础知识,然后详细解析了CART算法的工作机制,包括特征选择和树的构建。接着,通过Python和PyTorch的实例代码展示了CART算法在实际问题中的应用。...
-
聊一聊高精地图的数据问题,无图感知还有哪些坑要踩?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在自动驾驶领域,高精地图在定位、规划和避碰等方面发挥着至关重要的作用,实现行车安全和高质量路线预测。然而高精地图的构建都是昂贵、复杂的,而且专业性很强,无论是在硬件组成还是软件及其所使用的算法方面。...
-
微调 Code Llama 完整指南
一、前言 今天这篇文章将向大家详细介绍如何对 Code Llama 进行微调,让它变成适合 SQL 开发的有利工具。对于编程开发任务,经过适当微调后的 Code Llama 的性能通常都会比普通的 Llama 强很多,特别是当我们针对具体任务进行优化时:...
-
ChatGPT专业应用:生成新闻稿
正文共 949 字,阅读大约需要 4 分钟 媒体工作者必备技巧,您将在4分钟后获得以下超能力: 生成新闻稿 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编...
-
教你如何使用PyTorch解决多分类问题
本文分享自华为云社区《使用PyTorch解决多分类问题:构建、训练和评估深度学习模型》,作者: 小馒头学Python。 引言 当处理多分类问题时,PyTorch是一种非常有用的深度学习框架。在这篇博客中,我们将讨论如何使用PyTorch来解决多分类...
-
计算机视觉中目标检测的数据预处理
本文涵盖了在解决计算机视觉中的目标检测问题时,对图像数据执行的预处理步骤。 首先,让我们从计算机视觉中为目标检测选择正确的数据开始。在选择计算机视觉中的目标检测最佳图像时,您需要选择那些在训练强大且准确的模型方面提供最大价值的图像。在选择最佳图像时,考...
-
数据分层:打造数据资产管家
一、引言 随着企业数据规模的增长,数据的价值变得越来越重要。然而,传统的数据库在承载大量数据时面临挑战,需要高效有序的维护。因此,建立高效的数据仓库成为了企业决策和管理的基石,但现代技术的背景下,数据管理和保护仍然存在着重要挑战。 为了解决这些挑战,数...
-
燕小千AIGC大模型集成,实现企业文档的智能问答,燕千云v1.21.0全新版本与你“童”行!
5月26日,燕千云数智化业务服务平台发布了1.21版本,此次版本大升级主要围绕系统易用性提升,对在线客服、智能助理及企微移动端进行优化、新增上下游管理、重复问题分析等功能,多方面增加了IT服务的场景,从功能层面深化了燕千云智能的用户体验,提升了燕千云移动端...
-
最新!基于视觉方案的车辆速度、距离估计综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文名称:Vision-based Vehicle Speed Estimation: A Survey 导读 在精确检测车速车距的方案中,视觉方案是非常具有挑战性的,但由于没有昂贵的距离传感器而大幅...
-
AIGC技术周报|ChatDoctor:哪里不舒服;HuggingGPT:连接大模型和机器学习社区;ChatGPT真的鲁棒吗?
AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及Dall·E 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。...
-
运行基于云的生成式AI系统的几个优秀实践
译者 | 布加迪 审校 | 重楼 您猜怎么着?云计算会议现在是生成式AI会议。怎么会这样?很简单,云提供商将生成式AI视为销售更多云服务的最佳方式了。 随着企业界转向AI驱动的生态系统,这一幕主要在云计算环境中上演。在这里您通常可以找到最先进的生成式A...
-
【AI绘图】一、stable diffusion的发展史
一、stable diffusion的发展史 本文目标:学习交流 对于熟悉SD的同学,一起学习和交流使用过程中的技巧和心得。 帮助新手 帮助没有尝试过SD但又对它感兴趣的同学快速入门,并且能够独立生成以上效果图。 1.发展史介绍: 2...
-
UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的最先进 AI 方法
LLM,如 ChatGPT,可以轻松地产生各种流利的文本,但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉,这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性...
-
为什么知识管理是 AI 成功的基础?
为 AI 提供正确的上下文可以提高准确 性并减少幻觉。 在所有关于人工智能如何彻底改变工作(使日常任务更高效、更可重复,并增加个人努力)的对话中,人们很容易得意忘形:人工智能不能做什么? 尽管它的名字叫生成式人工智能,但能够创建图像、代码、文本、音乐...
-
一种全新的日志异常检测评估框架:LightAD
本文分享自华为云社区《【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用》,作者: DevAI。 深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测...
-
DeepMind推出OPRO技术,可优化ChatGPT提示
在最新的AI研究报道中,Google DeepMind推出了一项名为“优化通过提示(OPRO)”的技术,将大型语言模型(LLM 作为其自身提示的优化器。该方法旨在通过自然语言描述问题,指导LLM生成和改进解决方案,从而提高提示性能。 OPRO的工作方式相对...
-
从数据到诊断:谈青光眼的深度学习方法检测
青光眼是造成全球无数民众罹患不可逆失明的重要致残因素。青光眼本身只是统称,指代一系列对眼部与大脑视神经之间的连接造成损害的眼部疾病,严重时可导致视力丧失。根据布莱恩霍尔顿视觉研究所对全球失明及远视障碍原因的系统回顾与深入分析,青光眼已经成为全球第二大致...
-
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
人工智能(AI)在医学影像诊断方面的应用已经有了长足的进步。然而,在未经严格测试的情况下,医生往往难以采信人工智能的诊断结果。对于他们来说,理解人工智能根据医学影像给出的判别,需要增加额外的认知成本。 为了增强医生对辅助医疗的人工智能之间的信任,让 AI...
-
微软230页报告,像素级评估GPT-4前沿科研能力:潜力无限速速上车!
LLM作为研究工具,能否帮助科学研究带来新的突破? 今天微软AI4Science Research抛出一篇230页的重磅论文,告诉所有的科研人员: LLM(GPT-4)太强了,赶快想办法用起来! 论文地址:https://arxiv.org/abs/2...
-
大语言模型之七- Llama-2单GPU微调SFT
(T4 16G)模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener...
-
Stable Diffusion系列(一):古早显卡上最新版 WebUI 安装及简单操作
文章目录 Stable Diffusion安装 AnimateDiff插件适配 sdxl模型适配 Stable Diffusion使用 插件安装 界面设置 基础文生图 加入lora的文生图 Stable Diffusion安...