-
全球最强大模型易主 GPT-4被超越:Claude 3系列模型发布
Anthropic 发布的 Claude3系列模型超越了 GPT-4,在多模态和语言能力上表现出色。Claude3系列模型包括 Opus、Sonnet 和 Haiku,能力依次从低到高,可以根据需求选择合适的模型。 Opus 是最先进的模型,在多项评估标准...
-
全面超越GPT-4,Claude 3终于来了,有大学生智商,支持百万token
大模型的纯文本方向,已经卷到头了? 刚刚,OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude3。 该系列包含三个模型,按能力由弱到强排列分别是 Claude3Haiku、Claude3Sonnet 和 Cla...
-
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
这一次,谷歌 DeepMind 在基础模型方面又有了新动作。 我们知道,循环神经网络(RNN)在深度学习和自然语言处理研究的早期发挥了核心作用,并在许多应用中取得了实功,包括谷歌第一个端到端机器翻译系统。不过近年来,深度学习和 NLP 都以 Transf...
-
【MacOS】openai 语音识别模型 whisper 本地部署教程(cpu+mps方案)
目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程 安装homebrew 安装Python (不要超过3.10) 安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项 可...
-
华为云盘古大模型通过金融大模型标准符合性验证
据华为官方消息,2023年12月,在中国信通院组织的可信AI大模型标准符合性验证中,华为云盘古大模型成功完成了金融大模型的验证,并获得了优秀级(4+级)评分。这一成绩不仅突显了华为云盘古大模型在金融领域的卓越性能,还使其成为首批通过金融大模型及行业大模型标...
-
7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力
图神经网络(GNNs)擅长利用图的结构信息进行推理,但它们通常需要特定于领域的调优才能达到峰值性能,这阻碍了它们在不同任务之间的泛化性。 相比之下,基于大型语言模型(LLM)的图推理具有更强的跨任务和泛化能力,但它们在特定任务上的性能往往逊色于专用的图...
-
论文降重怎么降的 ai写作
大家好,小发猫降重今天来聊聊论文降重怎么降的 ai写作,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:论文降重,一篇文章带你了解全过程 在学术界,论文降重是许多学者必须面对的一道难题。...
-
今日AI:英伟达大模型Nemotron-4登场;ai贴纸Face to sticker火了;KOALA AI 模型问世;Hugging Face发现100个恶意模型
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 英伟达最强通用大...
-
VPR 2024 满分论文!Meta提出EfficientSAM:快速分割一切!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 EfficientSAM 这篇工作以5/5/5满分收录于CVPR 2024!作者在某社交媒体上分享了该结果,如下图所示: LeCun 图灵奖得主也强烈推荐了该工作! 在最近的一项研究中,Meta...
-
对抗「概念飘逸」难题!谷歌发布全新时间感知框架:图像识别准确率提升15%
在机器学习领域,概念漂移(concept drift)问题长期困扰着研究者,即数据分布随时间发生变化,使得模型难以持续有效。 一个显著的例子是CLEAR非稳态学习基准的图像展示,它揭示了物体视觉特征在十年间发生的显著变化。 这种现象被称为「缓慢的概念漂移...
-
一文搞懂:AI、机器学习与深度学习的联系与区别
在当今科技日新月异的浪潮中,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)与深度学习(Deep Learning, DL)如同璀璨星辰,引领着信息技术的新浪潮。这三个词汇频繁出现在...
-
ChatGPT编程时代来啦,GitHub Copilot Enterprise正式发布!
2月28日,全球最大开源平台之一GitHub在官网宣布——GitHub Copilot Enterprise正式全面发布。 GitHub Copilot Enterprise核心模块之一GitHub Copilot,是一款基于OpenAI的GPT-4模型,...
-
谷歌开源大模型Gemma带来了什么,原来“中国制造”的机会早已到来
谷歌罕见open的AI,给开源大模型到底带来了什么? Gemma从发布到现在已经时过四日,谷歌久违的这次开源,可谓是给全球科技圈投下了一枚重磅炸弹。 在最初发布之际,不论是从谷歌官方还是Jeff Dean的发文来看,都强调的是Gemma 7B已经全面超越...
-
端侧最强,Meta田渊栋等人卷10亿以下参数小模型,LeCun:小技巧启动
「在移动设备上运行 LLM?可能需要 Meta 的一些技巧。」刚刚,图灵奖得主 Yann LeCun 在个人社交平台表示。 他所宣传的这项研究来自 Meta 最新论文《 MobileLLM: Optimizing Sub-billion Paramet...
-
重要的医学AI应用:使用多模态 CNN-DDI预测药物间相互作用事件
生病时,医生往往给我们开了多种药物,这些药物在同时服下时是否因为药物间相互作用产生对身体不良的效果,这引起我们的怀疑和担心。其实医生所开的药方的药品已经经过了药物间相互作用的实验和临床测试,我们不应对此产生疑虑。 药物间相互作用(DDI)是指当一个患者同...
-
逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智
近期,谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时,前提信息的呈现顺序对其表现具有决定性影响。 在逻辑推理和数学问题中,前提按照逻辑自然顺序排列时,模型表现更佳。对于大型语言模型,改变前提叙述顺序会导致性能大幅下降,尤其是在添...
-
GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智
最近,谷歌DeepMind和斯坦福的研究人员发现:大模型在处理逻辑推理任务时,问题中信息呈现的顺序对模型的表现有着决定性的影响。 论文地址:https://arxiv.org/abs/2402.08939 具体来说,当信息按照逻辑上的自然顺序排列时,模...
-
一种推荐系统中的排序学习的原创算法:斯奇拉姆排序
作者 | 汪昊 审校 | 重楼 排序学习在推荐系统中的应用在最近数年来非常罕见。经典的算法比如 BPR 和 CLiMF 早在 10 多年前就已经被发明。因此当 2023 年国际会议 AIBT 2023 上有学者提出斯奇拉姆排序时,众多听众眼前一亮。该算...
-
AI搜索大变局
AI浪潮愈演愈烈的当下,信息量与应用需求迎来彻底爆发,外加参战厂商们急需寻找大模型落地场景,2024年无疑会成为AI应用场域争夺的“修罗场”。 贯览整个战局,仍不断发生着变化,新生力量不断跻身竞技场,传统巨头们也在试图演绎新的打法。而其中,AI搜索似乎成为...
-
【AIGC】Stable Diffusion之模型微调工具
推荐一款好用的模型微调工具,cybertron furnace 是一个lora训练整合包,提供训练 lora 模型的工具集或环境。集成环境包括必要的依赖项和配置文件、预训练脚本,支持人物、二次元、画风、自定义lora的训练,以简化用户训练 lora 模型...
-
大模型幻觉的起因、评估及落地场景下基于知识图谱的缓解策略探索
针对大模型落地应用的问题,当前行业内普遍的做法是利用大模型进行问答,但在实际应用中,这种方法往往效果不佳,很多问题的答案并不具有实际参考价值。作为算法人员,我们需要深入了解问题的来源,对于大模型产生的幻觉问题,我们需要明确其定义,是主观的还是客观的,并探...
-
AI自动化标注崛起,数据标注员要失业了?
在数据标注行业流行着一句话:“有多少智能,就有多少人工”。 由于需要标注的数据规模庞大且成本较高,一些互联网巨头及一些AI公司很少自己设有标注团队,大多交给第三方数据服务公司或者数据标注团队来做。 这也衍生出了专为AI而生的人力密集型的数据标注产业链。...
-
ChatGPT论文:大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较(二)
3 评价结果 3.1 Spider 数据集 表 2 列出了各种提示策略和模型组合的执行准确性 (EX 和测试套件 (TS 的准确性。我们的主要发现是: 开源模型在 Spider 数据集上遇到了困难:尽管参数数量和模型性能之间存在正相关关系...
-
科技部出手!科研人员的 AIGC 使用手册来了,学术界开始防范 AI 枪手
篡改实验数据、实验图片造假、论文不当署名、教材编写抄袭……1 月 16 日下午,华中农业大学的 11 名学生「一纸诉状」,以一份 125 页的举报材料实名举报该校黄姓教授存在学术不端行为。一时间,舆论迅速发酵,「赌上前程捍卫学术清白」、「人人都是学术造假受...
-
八项指标对比ChatGPT和文心一言
文章目录 前言 特定指标对比: 实际运用对比: 一、算力 二、训练时间 三、算法复杂度 四、模型结构 五、应用场景 六、性能指标 七、可解释性 八、迁移能力 ✍创作者:全栈弄潮儿 ? 个人主页: 全栈弄潮儿的个人主页 ?️ 个人...
-
硕士论文复查近五年 ai写作
大家好,今天来聊聊硕士论文复查近五年 ai写作,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 硕士论文复查近五年:必要性与技巧详解 一、背景介绍 随着学术研究的日益深入,硕士论文的质量控制...
-
半年连推7款产品,AI时代字节也能大力出奇迹吗?
在过去一年,字节跳动旗下多个团队接连推出了7款基于 AI 的产品,分布对话、工具、互动剧情等多个类别,字节跳动在 AI 应用赛道再次采多方向试错的策略,积极训练大模型、测试自家模型能力、寻找 AI 应用场景,一次投掷多个靶面。 从体量来看,尽管旗下多个产...
-
Whisper
文章目录 使后感 Paper Review 个人觉得有趣的 Log Mel spectrogram & STFT Training cross-atte...
-
Meta开源Code Llama 70B,缩小与GPT-4之间的技术鸿沟
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务
本文首发于微信公众号 CVHub,未经授权不得以任何形式售卖或私自转载到其它平台,违者必究! Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...
-
利用python+whisper生成视频字幕文件
文章目录 前言 1.本地环境 2.安装所需要的库 3.导入相关库 4.获取指定路径下的所有视频文件 5.导入模型进行音频识别 6.将识别结果转换为srt字幕文件 7.完成代码 前言 最近在看一些网课,由于没有字幕看着非常费劲,需要...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
了解AIGC在图像识别和生成中的应用
1.背景介绍 在过去的几年里,人工智能(AI 已经成为了我们生活中的一部分,它在图像识别和生成方面的应用也非常广泛。在这篇文章中,我们将探讨一下AI生成式图像识别(AIGC 在图像识别和生成中的应用,以及其背后的核心概念和算法原理。 1. 背...
-
【AIGC】prompt工程从入门到精通
注:本文示例默认“文心大模型3.5”演示,表示为>或w>(wenxin ,有时为了对比也用百川2.0展示b>(baichuan 有时候为了模拟错误输出,会用到m>(mock 表示(因为用的大模型都会给出正确答案) 有时候直接贴网络...
-
7B开源数学模型干翻千亿GPT-4,中国团队出品
7B开源模型,数学能力超过了千亿规模的GPT-4! 它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。 无需借助任何外部工具,它就能在竞赛水平的MATH数据集上达到51.7%的准确率。 在开源模型中,它第一个在该数据集上...
-
斯奇拉姆排序 - 基于公平性的排序学习
在 2023 年结束的国际学术会议 AIBT 2023 上,Ratidar Technologies LLC 宣读了一篇基于公平性的排序学习算法,并且获得了该会议的最佳论文报告奖。该算法的名字是斯奇拉姆排序 (Skellam Rank ,充分利用了统计学...
-
AIGC知识速递——Google的Bert模型是如何fine-tuning的?
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? 选择合适的预训练模型: 从预训练的BERT模型开始,例如Google 提供的BERT-base 或 BERT-large。这些模型已经...
-
探索AI绘画:如何让算法创作美画
1.背景介绍 随着人工智能技术的不断发展,我们已经看到了许多令人惊叹的应用,例如自动驾驶、语音助手、图像识别等。在艺术领域,人工智能也开始发挥着重要作用,尤其是在绘画领域。AI绘画是一种通过算法和机器学习技术创作艺术作品的方法,它旨在让计算机或机...
-
联想MarTech智能营销平台荣获2023 iResearch Markting Awards金瑞营销奖”年度最佳AIGC营销平台”奖项,业界瞩目!
Ai工具集导航(Ai-321.com) 简述:2023 iResearch Markting Awards金瑞营销奖中,联想MarTech智能营销平台被评为”年度最佳AIGC营销平台”奖项的获奖情况。文章详细描述了联想MarTech智能营销平台的升级与迭代...
-
“国货之光”文心一言正式发布:百度大语言模型背后那些不为人知的细节
文章目录 前言 一、文心一言是什么 二、发布会内容 1.文学创作 2.商业文案创作 3.数理逻辑推算 4.中文理解 5.多模态生成 三、文心一言那些不为人知的细节 总结 前言 去年年末,ChatGPT以惊人的速度成为焦点,激...
-
AI读心术再升级!一副眼镜直接控制波士顿机器狗,脑控机器人成真
还记得之前的AI读心术吗?最近,「心想事成」的能力再次进化, ——人类可以通过自己的想法直接控制机器人了! 来自麻省理工的研究人员发表了Ddog项目,通过自己开发的脑机接口(BCI)设备,控制波士顿动力的机器狗Spot。 狗狗可以按照人类的想法,移动到特...
-
三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法
优化语义分割模型常用的损失有Soft Jaccard损失,Soft Dice损失和Soft Tversky损失,但它们都和软标签不兼容,所以无法支持一些重要的训练技术(例如标签平滑,知识蒸馏,半监督学习,多标注员等)。 另一方面,语义分割常用的评价指标...
-
人工智能在高等教育中的三种创新应用
高等教育专家必须为与AI的全面协作做好准备,否则很可能错失机会、与学生群体脱节。 根据Tyton Partners最新发布的调查结果,学生在使用生成式AI产品方面的速度远比老师更快。从具体数据来说,教职工群体中的AI频繁使用比例仅为22%,而学生的这一...
-
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下?
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下? 2024/1/26 21:19 问GTX1080模式使用large该如何配置呢? 这个问题没有完成,可能需要使用使用显存更大的显卡了! 比如G...
-
香港最大AI诈骗案:Deepfake换脸「英国CFO」,直接骗走公司2亿港币
【新智元导读】香港一家跨国公司员工,被骗子邀请进了用Deepfake做的「高管视频会议」中,下令让他转了2亿港币到不知名中账户,5天之后才发现被骗了。 这几天,古老的AI应用——「AI换脸」多次破圈,屡屡登上热搜。 先是网上充斥的大量泰勒斯威夫特的「AI艳...
-
香港最大AI诈骗案!Deepfake换脸「英国CFO」,直接骗走公司2亿港币
这几天,古老的AI应用——「AI换脸」多次破圈,屡屡登上热搜。 先是网上充斥的大量泰勒斯威夫特的「AI艳照」,逼得X(原推特)只能直接屏蔽了所有有关「Tylor Swift」的搜索。 而今天香港警方向社会公布了一起更离谱的诈骗案件: 一家英国跨国企业的中...
-
自媒体ai写作达人告诉你:这9款工具让你成为内容之王! #学习方法#人工智能
你是否因为写作困顿而感到沮丧?是不是希望能够找到一个能给你提供无限灵感和提高创作效率的利器?AI写作助手就是你的绝佳选择!现在我向大家推荐几款好用的AI写作助手,它们将让你的创作之旅更加流畅、富有创意。 1.写作兔 这是一个微信公众号 面向专...
-
ChatLaw:基于LLaMA微调的法律大模型
文章目录 动机 数据组成 模型框架 模型评估 北大团队发布首个的中文法律大模型落地产品ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。 github地址:https://g...
-
流量工程将代码生成的准确率提高一倍:由19%提高至44%
一篇新论文的作者提出了一种“强化”代码生成的方法。 代码生成是人工智能中一项越来越重要的能力。它指训练机器学习模型,基于对所需程序功能的自然语言描述自动生成计算机代码,并有许多潜在的应用,从将软件规格转换成实用代码、自动化后端开发到协助人类程序员,不一...
-
一文读懂「AIGC,AI Generated Content」AI生成内容
首先,让我们理解一下这两个概念。 AIGC,或者称之为人工智能生成内容,是指使用AI算法和模型来自动生成全新的、原创的内容。这种内容可以包括文本、图像、音频、视频等各种形式,甚至可以包括一些独特的形式,比如新颖的创意和设计。AIGC的应用领域非常广...