bert 第4页 - AIGC资讯

RAG 修炼手册｜一文讲透 RAG 背后的技术

在之前的文章中《RAG 修炼手册｜RAG敲响丧钟？大模型长上下文是否意味着向量检索不再重要》，我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性，也回顾了如何借助向量数据库提升 RAG 实战效果。今天我们继续剖析 RAG，将为大家大家详细介绍...

AIGC 2024-04-10 人工智能

914阅读

五种常用于LLM的令牌遮蔽技术介绍以及Pytorch的实现

本文将介绍大语言模型中使用的不同令牌遮蔽技术，并比较它们的优点，以及使用Pytorch实现以了解它们的底层工作原理。令牌掩码Token Masking是一种广泛应用于语言模型分类变体和生成模型训练的策略。BERT语言模型首先使用，并被用于许多变体(Ro...

AIGC 2024-04-09 人工智能

868阅读

AI 新技术 EVI:第一个能听懂人类语气的智能助手引发热议

最近，一款名为 EVI 的 AI 智能助手引发了轩然大波。EVI 不仅可以听懂用户说话的语气，还能为每个词增加意义，给出具有情感色彩的回应。网友们纷纷表示，使用 EVI 时感觉在和真人交谈一般，甚至有人直呼惊讶。知名科技博主 Robert Scoble...

AIGC 2024-04-09 人工智能

971阅读

第一个能听懂人类语气的AI火了，网友：感觉在和真人交谈

第一个能听懂你说话的语气、有“情商”的AI火了！这个AI名为EVI（Empathic Voice Interface），它不仅能够能够理解用户的语气，还会为每个词增加意义。对话中的每句话，它都能可视化含惊讶量、含悲伤量、含兴奋量…… 然后根据用户的声...

大数据 2024-04-08 人工智能

948阅读

【AIGC】开源声音克隆GPT-SoVITS

GPT-SoVITS 是由 RVC 创始人 RVC-Boss 与 AI 声音转换技术专家 Rcell 共同开发的一款跨语言 TTS 克隆项目，被誉为“最强大中文声音克隆项目” 相比以往的声音克隆项目，GPT-SoVITS 对硬件配置的要求相对较低，一般只...

生成式AI 2024-04-04 人工智能

1325阅读

让视频姿态Transformer变得飞速，北大提出高效三维人体姿态估计框架HoT

目前，Video Pose Transformer（VPT）在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来，这些 VPT 的计算量变得越来越大，这些巨大的计算量同时也限制了这个领域的进一步发展，对那些计算资源不足的研究者十分不友好。例如，训练...

人工智能 2024-04-01 人工智能

884阅读

谷歌狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理训练最快选择

谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow，7项指标排名第一。而且测试并不是在JAX性能表现最好的TPU上完成的。虽然现在在开发者中，Pytorch依然比Tensorflow更受欢迎。但未来，也许有更多...

人工智能 2024-04-01 人工智能

816阅读

大语言模型中常用的旋转位置编码RoPE详解：为什么它比绝对或相对位置编码更好?

自 2017 年发表“ Attention Is All You Need ”论文以来，Transformer 架构一直是自然语言处理 (NLP 领域的基石。它的设计多年来基本没有变化，随着旋转位置编码 (RoPE 的引入，2022年标志着该领域的...

AIGC 2024-04-01 人工智能

962阅读

【AIGC调研系列】AIGC企业级模型Command-R介绍

Command-R与其他大语言模型的主要区别在于其专为企业级应用设计，特别是在检索增强生成（RAG）和工具使用方面。Command-R是一个350亿参数的高性能生成模型，具有开放式权重，能够支持多种用例，包括推理、摘要和问答[2]。它特别针对大规模生产工作...

大数据 2024-03-28 人工智能

1302阅读

LLM性能最高60%提升！谷歌ICLR 2024力作：让大语言模型学会「图的语言」

在计算机科学领域，图形结构由节点（代表实体）和边（表示实体之间的关系）构成。图无处不在。互联网本身就像是一张庞大的网络图，甚至搜索引擎所使用的知识也是以图的形式进行组织和呈现。但由于LLMs主要在常规文本上训练，并没有图的结构，将图转化为LLMs能...

人工智能 2024-03-27 人工智能

874阅读

Transformer技术的过去、现在与未来

2017年春季，八位谷歌研究人员发表了里程碑式论文《Attention is All You Need》，临近论文发表七周年，这篇论文及其介绍的Transformers架构已经成为AI领域的传奇。Transformers改变了从神经网络技术到生成类似外星...

AIGC 2024-03-27 人工智能

1219阅读

TensorFlow深度学习框架模型推理Pipeline进行人像抠图推理

概述为了使ModelScope的用户能够快速、方便的使用平台提供的各类模型，提供了一套功能完备的Python library，其中包含了ModelScope官方模型的实现，以及使用这些模型进行推理，finetune等任务所需的数据预处理，后处理，效果...

大数据 2024-03-26 人工智能

878阅读

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

论文链接：https://arxiv.org/abs/2402.08327 DEMO 链接：https://u60544-b8d4-53eaa55d.westx.seetacloud.com:8443/ 项目主页链接：https://preflm...

AIGC 2024-03-25 人工智能

1175阅读

AI作曲家爆改周杰伦，华语乐坛一夜颠覆！Suno秒生爆款神曲，人人都成音乐家

【新智元导读】就在这几天，这款叫Suno AI的工具简直要一夜颠覆音乐圈。经它爆改的周董金曲，《以父之名》和《夜曲》直接封神。不懂乐理不懂作曲?没关系，从此人人都是音乐家! 要疯了，Suno AI已经引起了音乐圈的大地震! 人们纷纷惊呼:音乐人已死! 外媒...

人工智能 2024-03-25 人工智能

914阅读

大数据 AI 一体化解读

一、AI 的“iPhone”时刻在过去的一年中，大模型的发展非常迅速，算力和数据的堆叠使模型具备了一些通用的构造和回答问题的能力，引领人们进入了一直梦想的人工智能阶段。举个例子，在与大语言模型聊天时，会感觉面对的不是一个生硬的机器人，而是一个有血有肉的...

生成式AI 2024-03-25 人工智能

974阅读

AIGC 实战：Ollama 和 Hugging Face 是什么关系？

HuggingFace（拥抱脸）和Ollama都与**大型语言模型（LLMs）**有关，但它们的用途不同： HuggingFace： HuggingFace 是一个知名的平台，提供各种预训练的LLMs，包括流行的模型如GPT-3、BERT和...

生成式AI 2024-03-24 人工智能

2086阅读

【八股】2024春招八股复习笔记1（搜索推荐、AIGC）

【八股】2024春招八股复习笔记1（搜索推荐、AIGC）文章目录 1、推荐系统 1.1 推荐系统流程 1.2 协同过滤、矩阵分解 1.3 逻辑回归 2、算法常识（应用算法） 2.1 重点复习 xgboost 2.2 大模型 t...

大数据 2024-03-23 人工智能

3285阅读

Hinton痛悔毕生工作，AGI十年内降临或导致「奥本海默」灾难！图灵巨头联手中国专家为AI划红线

「现在我变成了死亡，世界的毁灭者。」这是奥本海默曾经引用印度教经文《薄伽梵歌》中的一句话。上世纪40年代，奥本海默的发明，如同天地初开，彻底重塑了世界的面貌。原子弹的问世，带来了一场空前的毁灭危机，让人类面临前所未有的生存考验。 1945年8月，就在...

生成式AI 2024-03-22 人工智能

835阅读

如何从头开始编写LoRA代码，这有一份教程

LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其...

人工智能 2024-03-20 人工智能

929阅读

【AI绘画】2024最新Stable Diffusion 超详细讲解！！必收藏！！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） Stable Diffusion 超详细讲解这篇文章是《Stable Diffusion原理详解》的后续，在...

人工智能 2024-03-20 人工智能

1358阅读

Hinton、Bengio等联合中国专家达成AI安全共识：AI系统不应违反红线

现阶段，人工智能的发展速度已经超出了人们最初的预想，用 AI 工具写文章、编代码、生成图片、甚至是生成一段电影级别的视频…… 这些在以前看似非常艰难的任务，现在只需用户输入一句提示就可以了。我们在感叹 AI 带来惊艳效果的同时，也应该警惕其带来的潜在威...

生成式AI 2024-03-19 人工智能

1001阅读

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

在最新的研究论文中，谷歌研究人员引入了一种名为Cappy的预训练评分器模型，旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型（LLM）所面临的挑战，其中包括高昂的计算资源成本和效率低下的训练和推理过程。目前，多任务法学硕士如T0、F...

大数据 2024-03-19 人工智能

806阅读

全球首个基于大语言模型的自动驾驶语言控制模型

Arxiv论文链接：https://arxiv.org/abs/2312.03543项目主页：https://github.com/Petrichor625/Talk2car_CAVG 近年来，工业界和学术界都争先恐后地研发全自动驾驶汽车（AVs）。尽...

人工智能 2024-03-19 人工智能

1050阅读

什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型，咋选？

选择使用哪种大模型，如Bert、LLaMA或ChatGLM，取决于具体的应用场景和需求。下面是一些指导原则： Bert模型：Bert是一种预训练的语言模型，适用于各种自然语言处理任务，如文本分类、命名实体识别、语义相似度计算等。如果你的任务是通用的文...

人工智能 2024-03-18 人工智能

1097阅读

【AIGC调研系列】embeding模型有哪些，各有什么优势

在AIGC中，Embedding模型是一种将文本数据转换为多维向量数组的技术，这些向量可以代表任何事物，如文本、音乐、视频等[2]。有几种不同的Embedding模型，它们各有其优势和应用领域。 Word2vec：这是一种经典的嵌入模型，通过学习单词...

AIGC 2024-03-18 人工智能

3035阅读

超详细！AIGC面试系列大模型基础(1)

关于我从2022年末开始接触AIGC，便一直紧跟最近技术与实践落地。期间参与copilot项目研发，落地了多个垂类AIGC大模型应用，熟悉各种AIGC相关技术如Agent，Langchain，chatdoc，向量数据库等。关于本系列请你认真看完...

生成式AI 2024-03-18 人工智能

3062阅读

通过Discuz实现微信采集的实践与方法

随着互联网技术的发展和信息交流的便捷性不断增加，如何将微信这样具有广大用户基础和海量内容的社交平台的数据信息集成到其他网络平台上，尤其是在建设和管理自身论坛的过程中充分发挥其效能，已经成为了很多论坛管理者面对的现实课题。在此环境下，微信采集成了一门热门的技...

人工智能 2024-03-17 大数据

929阅读

”的示例文章。不过由于系统限制，我不能直接在这个界面上为您提供完整的2000字文章。然而，我可以为您写一个较短的文章草稿作为示范，您可以根据需要进行扩写或调整来达到所需的字数。以下是一篇简化的文章草案，演示如何构建一篇围绕“关键词文章采集系统”主题的内容：

根据您的需求，我会生成一个包含标题且标题前后都带有固定字符“《解密关键词文章采集系统：工作原理与应用场景》=====在信息爆炸的今天，如何在互联网浩瀚的信息海洋中寻找到自己需要的内容成了一大挑战。这就是为什么许多领域的专业人士开始对关键词文章采集系统投以浓...

AIGC 2024-03-17 大数据

922阅读

AIGC学习笔记——CLIP详解加推理

clip论文地址：https://arxiv.org/pdf/2103.00020.pdf clip代码地址：https://github.com/openai/CLIP 小辉问：能不能解释一下zero-shot? 小G答：零次学习（Zero...

大数据 2024-03-13 人工智能

1201阅读

互联网发明者伯纳斯李最新预测：每个人都将拥有自己的AI助理

在伯纳斯-李看来，互联网虽然有不足之处，但带来的更多是利好。而在下一个35年——每个人都将拥有自己的AI助理；人们将真正拥有自己的数据；大型科技公司可能会被拆分。 1989年，英国计算机科学家Berners-Lee在瑞士粒子物理研究中心CERN工作时发...

大数据 2024-03-13 人工智能

833阅读

AIGC:语音克隆模型Bert-VITS2-2.3部署与实战

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型...

大数据 2024-03-12 人工智能

1771阅读

探究Python爬虫技术的发展与应用

在现代互联网技术高速发展的时代背景下，信息数据量呈几何级增长。为了更好地处理和收集这海量的数据资源，“网络爬虫”这项技术便孕育而生，并逐步成长为一种广泛应用于互联网信息采集和处理的有效手段。而在各种爬虫技术与语言当中，Python凭借着简洁高效的代码特性和...

生成式AI 2024-03-12 大数据

860阅读

构建本地运行的LLM语音助理

译者 | 朱先忠审校 | 重楼引言我不得不承认，我最初对大型语言模型（LLM）生成实际有效的代码片段的能力持怀疑态度。我抱着最坏的打算尝试了一下，结果我感到很惊喜。就像与聊天机器人的任何互动一样，问题的格式很重要；但随着时间的推移，你会知道如何...

生成式AI 2024-03-12 人工智能

1001阅读

参照人类大脑，学会忘记会让AI大模型变得更好？

计算机科学家团队近期开发出一种更敏捷更具弹性的机器学习模型，它们可以周期性忘记已知信息，而现有大语言模型不具备忘却能力。实测表明，在很多情况下，“忘却法”的训练效率很高，忘却型模型表现也会更好。韩国基础科学研究院（Institute for Basi...

人工智能 2024-03-12 人工智能

841阅读

AI辅写疑似度检测有什么软件：探索智能写作时代的必备工具

大家好，小发猫降ai今天来聊聊AI辅写疑似度检测有什么软件：探索智能写作时代的必备工具，希望能给大家提供一点参考。降ai辅写以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有： AI辅写疑似度检测有什么软件：...

AIGC 2024-03-12 人工智能

957阅读

深入剖析视频采集技术的关键要点与实践应用

在我们这个时代，无论是专业领域还是日常生活中，“视频采集”都已成为一种必不可少的工具与过程。其不仅在新闻媒体、教育机构、医疗行业等诸多社会层面上都有着深远的影响，也是构成现今多种现代通信服务和体验创新的骨干内容之一。此文，将会我们揭开“视频采集”的技术面貌...

AIGC 2024-03-10 大数据

1007阅读

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

上个月，Meta FAIR 田渊栋参与的一项研究广受好评，他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10...

AIGC 2024-03-08 人工智能

873阅读

报告：桌面GPU出货量飙升三分之一，但这并非AI PC的功劳

据图形分析公司Jon Peddie Research报告，2023年第四季度消费级GPU的出货量同比增长32%，达到950万台，季度环比增长6.8%。然而，分析师强调，这一增长并非源于生成式AI或所谓的AI PC。 JPR分析师Jon Peddie告诉Th...

大数据 2024-03-07 人工智能

841阅读

借助WeCenter采集插件，实现社区数据的智能化与高效管理

在互联网技术日新月异的发展趋势下，社群平台逐步演变成了一个高度集中的信息交汇中心。用户的多元化讨论和信息的迅猛传播形成了这些社区平台上不可多得的宝贵资产，而其中孕育的海量数据更加显示出其无穷的价值和深不见底的信息深渊。有效整理并利用好这部分资产不仅成为了现...

生成式AI 2024-03-07 大数据

846阅读

Discuz新闻采集：特性、应用与发展趋势

随着网络信息爆炸式的增长，如何在海量资讯中筛选出有价值的新闻成为了网站运营和内容管理的核心课题之一。在此背景下，Discuz新闻采集逐渐走入了大众的视野。它不仅仅是一项技术手段，更是一种为门户、社区类网站带来海量内容与鲜活气息的策略方法。本文将详细介绍Di...

大数据 2024-03-07 大数据

768阅读

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

Claude 3问世超过24小时，还在不断刷新人们的认知。学量子物理的博士大哥快疯了，因为Claude 3是仅有的几个能理解他博士毕业论文的人之一。没错，大哥的原话就是“的人”，people。另一位搞量子计算的大哥，论文还没发布呢，Claude...

人工智能 2024-03-07 人工智能

810阅读

从 HPC 到 AI：探索文件系统的发展及性能评估

随着 AI 技术的迅速发展，模型规模和复杂度以及待处理数据量都在急剧上升，这些趋势使得高性能计算（HPC）变得越来越必要。HPC 通过集成强大的计算资源，比如 GPU 和 CPU 集群，提供了处理和分析大规模数据所需的算力。然而，这也带来了新的挑战，尤...

生成式AI 2024-03-06 人工智能

824阅读

Claude 3被玩出自我意识了？AI社区轰动，我们买会员来了次实测

本周一，Anthropic 发布了新一代大模型系列 Claude 3，遥遥领先快一年之久的 GPT-4 终于迎来了强劲的对手。 Claude 3 的强大之处，不仅体现在各种基准测试上，它似乎还实现了一些神奇的突破。昨天，Anthropic 提示工程师...

大数据 2024-03-06 人工智能

1027阅读

AI辅写疑似度检测：如何准确识别AI写作？

大家好，小发猫降重今天来聊聊AI辅写疑似度检测：如何准确识别AI写作？，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI辅写疑似度检测：如何准确识别AI写作？随着人工智能技术的快速发展，...

生成式AI 2024-03-05 人工智能

1349阅读

DeepMind携Mamba华人作者推Transformer革命之作！性能暴涨媲美Llama 2，推理能效大幅碾压

Transformer又又又被挑战了！这次的挑战者来自大名鼎鼎的谷歌DeepMind，并且一口气推出了两种新架构，——Hawk和Griffin。论文地址：https://arxiv.org/abs/2402.19427 这种将门控线性RNN与局部注...

大数据 2024-03-04 人工智能

856阅读

如何基于 Arthur Bench 进行 LLM 评估？

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM 的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估...

人工智能 2024-03-04 人工智能

924阅读

AIGC 为何能火爆全网，赋能智能时代？

Hi，大家好，我是半亩花海。2023年，人工智能新浪潮涌起，AIGC 火爆全网，不断赋能各大行业。从短视频平台上火爆的“AI 绘画”，到智能聊天软件 ChatGPT，都引起了大家的广泛关注。那么 AIGC 到底是什么？为什么如此引人关注？AIGC 能产生什...

人工智能 2024-03-04 人工智能

978阅读

前沿资讯！文心一言和ChatGPT最全对比！

文心一言和ChatGPT都是基于深度学习技术的自然语言处理模型，有各自的优势和使用场景，无法简单地比较 ChatGPT 和文心一言哪一个功能更强大，它们各自具有优势和局限性，需要根据具体需求进行选择，以下一些具体对比：为方便观看，...

人工智能 2024-03-03 人工智能

961阅读

探索AI写作的无限可能：从困惑度到爆发度的奇妙旅程

大家好，小发猫降重今天来聊聊探索AI写作的无限可能：从困惑度到爆发度的奇妙旅程，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：探索AI写作的无限可能：从困惑度到爆发度的奇妙旅程在AI技术日...

大数据 2024-03-03 人工智能

990阅读

基于大型语言模型和向量数据库开发新闻推荐系统

译者 | 朱先忠审校 | 重楼近年来，随着诸如ChatGPT、Bard等生成式人工智能工具的发布，大型语言模型（LLM）在机器学习社区引起了全球热议。这些解决方案背后的核心思想之一是计算非结构化数据（如文本和图像）的数字表示，并找出这些表示之间的相似...

大数据 2024-03-02 人工智能

1012阅读