bert 第9页 - AIGC资讯

解读Lawyer LLaMA，延申专业领域大模型微调：数据集构建，模型训练

解读Lawyer LLaMA，延申自己领域大模型微调：数据集构建，模型训练项目地址link 自己领域的大模型微调，实现思路大都和这篇文章是一样的，有的是基于LLaMA,或者有的是基于Chinese-LLaMA,或者是其他开源的大模型，本文基于自己训...

人工智能 2023-12-01 人工智能

594阅读

AI工智能讲师叶梓培训简历及提纲：AI人工智能之基于人工智能的内容生成（AIGC）简历提纲

叶梓老师简介威信：amliy007 上海交通大学计算机专业博士毕业，高级工程师，高级程序员主研方向：数据挖掘、机器学习、人工智能。国内知名上市IT企业的AI技术总监、资深技术专家一线人工智能经验（12年），大...

生成式AI 2023-11-30 人工智能

541阅读

聊一聊大模型 | 京东云技术团队

事情还得从ChatGPT说起。 2022年12月OpenAI发布了自然语言生成模型ChatGPT，一个可以基于用户输入文本自动生成回答的人工智能体。它有着赶超人类的自然对话程度以及逆天的学识。一时间引爆了整个人工智能界，各大巨头也纷纷跟进发布了自家的大模...

生成式AI 2023-11-30 人工智能

413阅读

LLaMA 的学习笔记

LLaMA 是一种用于自然语言处理的深度学习模型，它的全称是 Language Learning with Adaptive Multi-task Architecture。它的主要特点是能够根据不同的任务自适应地调整模型结构和参数，从而提高模型的泛化能力...

人工智能 2023-11-30 人工智能

530阅读

微软推出ML.NET 3.0版本，扩展了深度学习功能

11月29日消息，据外媒报道，微软日前发布了ML.NET 3.0，这是该公司开源、跨平台机器学习框架的最新版本，可以将机器学习模型集成到.NET应用程序中。 ML.NET 3.0在对象检测、命名实体识别和问题回答方面包含了新的深度学习功能。通过与Tor...

大数据 2023-11-29 人工智能

459阅读

微软推出跨平台框架 ML.NET 3.0 版本：强化深度学习功能、加强 AI 计算效率

IT之家 11 月 29 日消息，微软日前宣布推出跨平台机器学习框架 ML.NET 3.0，主要强化了深度学习功能，改进 ML.NET 数据处理能力，并添加了英特尔 oneDAL 加速训练技术，以及自动机器学习等功能。 ▲ 图源微软 IT之家注意到，M...

AIGC 2023-11-29 人工智能

437阅读

Keras 3.0一统江湖！大更新整合PyTorch、JAX，全球250万开发者在用了

刚刚，Keras 3.0正式发布！经过5个月的公开Beta测试，深度学习框架Keras 3.0终于面向所有开发者推出。全新的Keras 3对Keras代码库进行了完全重写，可以在JAX、TensorFlow和PyTorch上运行，能够解锁全新大模型训...

大数据 2023-11-29 人工智能

455阅读

【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总

网安AIGC专题写在最前面一些碎碎念课程简介 0、课程导论 1、应用 - 代码生成 2、应用 - 漏洞检测 3、应用 - 程序修复 4、应用 - 生成测试 5、应用 - 其他 6、模型介绍 7、模型增强 8、数据集 9、模型安全...

大数据 2023-11-29 人工智能

502阅读

在少样本学习中，用SetFit进行文本分类

译者 | 陈峻审校 | 重楼在本文中，我将向您介绍“少样本（Few-shot）学习”的相关概念，并重点讨论被广泛应用于文本分类的SetFit方法。传统的机器学习（ML）在监督（Supervised）机器学习中，大量数据集被用于模型训练，以便...

人工智能 2023-11-28 人工智能

489阅读

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta，这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中，大语言模型并不一定就是最优的解决...

AIGC 2023-11-27 人工智能

459阅读

OpenAI内乱之害远未止

继OpenAI最近的争议后，AI工程师和公司开始减少乃至完全摆脱对其API的依赖。译自Pivot! AI Devs Move to Switch LLMs, Reduce OpenAI Dependency，作者 Richard MacManus 是...

大数据 2023-11-27 人工智能

498阅读

如何使用GPTQ量化使LLM更轻

译者 | 李睿审校 | 重楼大型语言模型(LLM 应用的一大挑战是其耗费巨大的内存和计算需求，通常需要数十GB的GPU内存。这使得它们不仅昂贵而且难以运行。为了缓解这些问题，研究人员开发了几种LLM压缩技术，其中包括“量化”。量化通过改变参数的存...

AIGC 2023-11-27 人工智能

709阅读

大模型的实践应用6-百度文心一言的基础模型ERNIE的详细介绍，与BERT模型的比较说明

大家好，我是微学AI，今天给大家讲一下大模型的实践应用6-百度文心一言的基础模型ERNIE的详细介绍，与BERT模型的比较说明。在大规模语料库上预先训练的BERT等神经语言表示模型可以很好地从纯文本中捕获丰富的语义模式，并通过微调的方式一致地提高各种NLP...

生成式AI 2023-11-27 人工智能

534阅读

模型杂谈：使用 IN8 量化推理运行 Meta “开源泄露”的大模型（LLaMA）

接着之前文章《模型杂谈：快速上手元宇宙大厂 Meta “开源泄露”的大模型（LLaMA）》一文中的话题，继续聊聊如何使用 INT8 量化的方式来让低显存的设备能够将模型运行起来。写在前面前几天，在知乎上看到《如何评价 LLaMA 模型泄露？》问题...

人工智能 2023-11-26 人工智能

519阅读

OpenAI神秘Q毁灭人类？爆火「Q假说」竟牵出世界模型，全网AI大佬长文热议

Q* 【新智元导读】传闻中OpenAI的Q*，已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文，猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI，已是临门一脚了? Ope...

人工智能 2023-11-25 人工智能

437阅读

【网安AIGC专题11.1】11 Coreset-C 主动学习：特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)

Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面论文名片先验知识的补充主动学习采样函数 benchmark基准和base...

大数据 2023-11-25 人工智能

531阅读

【多模态】4、Chinese CLIP | 专为中文图文匹配设计

文章目录一、背景二、方法 2.1 基础内容 2.2 数据集 2.3 预训练方法 2.4 模型尺寸三、效果四、代码 4.1 推理论文：Chinese CLIP: Contrastive Vision-Language Pr...

人工智能 2023-11-24 人工智能

1296阅读

stable-diffusion领域prompt集合

有什么写实的stable diffusion模型？ - 知乎试了试这个模型，感觉勉强，大佬们知道有没有更写实的模型？https://huggingface.co/CompVis/stable-diff…https://www.zhihu.com/quest...

人工智能 2023-11-24 人工智能

514阅读

由文心一言发布会引发的思考，聊聊我未来的学习规划

文章目录前言一. 文心一言的试用 1.1 文心一言发布会 1.2 文心一言图片生成功能试用 1.3 文心一言文本功能试用 1.4 文心一言代码功能试用 1.5 试用总结二. 我未来的学习规划 2.1 向csdn的大佬请教 2.2 关...

大数据 2023-11-24 人工智能

466阅读

AI加速“科技权势”集中，巨头垄断AI会造成严重后果吗？

大家有没有发现，AI技术似乎相当集中，科技巨头占尽优势。基于这一现实，许多科技高管纷纷发声预警，他们认为：科技巨头本来已经拥有相当大的权势，到了AI时代权势将会更大。去年OpenAI推出ChatGPT，它可以根据提示给出答案，瞬间引爆了生成式AI大变革...

AIGC 2023-11-24 人工智能

454阅读

研究人员开发自动识别古代楔形文字片的AI软件

一项由马丁·路德大学哈勒-维滕贝格（MLU）、约翰内斯·古腾堡大学迈因茨分校和迈因茨应用科学大学团队开发的新型人工智能软件如今能够解读难以辨认的楔形文字。与以往依赖照片的方法不同，该AI系统利用楔形文字片的3D模型，传递的结果比先前的方法更加可靠。这使得能...

AIGC 2023-11-24 人工智能

453阅读

AIGC音乐的中场战事：从技术、产品到商业规则

最近，谷歌围绕着AIGC音乐打出了一套“组合拳”。 11月16日，谷歌旗下 DeepMind发布了最新的AIGC音乐生成模型Lyria，并与YouTube合作打造了两个重要应用场景:Dream Track和Music AI tools。同时，谷歌和YouT...

人工智能 2023-11-23 人工智能

487阅读

独家 | 为DALL·E 2花了15美元创作这幅AI图像以后，我学到了……

作者：Joy Zhang 翻译：陈超校对：赵茹萱本文约3000字，建议阅读8分钟本文介绍了作者使用DALL·E 2生成了美洲驼灌篮的逼真版图片的过程。是的，这是一只美洲驼灌篮。一份对DALL·E 2封闭测试版试验的过程、限制以及...

人工智能 2023-11-22 人工智能

446阅读

UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的最先进 AI 方法

LLM，如 ChatGPT，可以轻松地产生各种流利的文本，但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉，这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性...

生成式AI 2023-11-21 人工智能

757阅读

MatrixOne 实战系列回顾 | 建模与多租户

本次分享主要介绍MatrixOne建模与多租户相关内容。 1 建模 #1 与MySQL的区别使用create table语句建表和MySQL建表语句基本相同，也有几点要注意。 MatrixOne暂不支持空间数据类型，其他数据类型在保持与 MyS...

人工智能 2023-11-21 人工智能

418阅读

一种全新的日志异常检测评估框架：LightAD

本文分享自华为云社区《【AIOps】一种全新的日志异常检测评估框架：LightAD，相关成果已被软工顶会ICSE 2024录用》，作者： DevAI。深度学习（DL）虽然在日志异常检测中得到了不少应用，但在实际轻量级运维模型选择中，必须仔细考虑异常检测...

人工智能 2023-11-21 人工智能

491阅读

Grounding dino + segment anything + stable diffusion 实现图片编辑

目录总体介绍总体流程模块介绍目标检测： grounding dino 目标分割：Segment Anything Model (SAM 整体思路模型结构：数据引擎图片绘制集成样例其他问题附录总体介绍...

生成式AI 2023-11-21 人工智能

873阅读

训练AI助理实现SumTo100游戏自学习与结果预测

译者 | 朱先忠审校 | 重楼简介在一款完美的信息类游戏中，如果你所需要的一切都能够让每一个玩家在游戏规则中看到，这不是一件很神奇的事情吗？但遗憾的是，对于像我这样的普通玩家来说，阅读有关一款新游戏的玩法规则只是学习玩复杂游戏旅程中的一小部分，而...

生成式AI 2023-11-20 人工智能

432阅读

揭秘百度文心一言大模型：设计、应用与实战

导言在当今的深度学习领域，大型预训练模型如GPT、BERT等已经取得了显著的进展。而百度公司的文心一言大模型，作为一款基于Transformer结构的巨型模型，也在自然语言处理领域产生了重大影响。本文将详细介绍文心一言大模型的设计原理、特点以及应用场...

人工智能 2023-11-20 人工智能

948阅读

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷，并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...

人工智能 2023-11-18 人工智能

511阅读

13B模型全方位碾压GPT-4？这背后有什么猫腻

一个参数量为 13B 的模型竟然打败了顶流 GPT-4？就像下图所展示的，并且为了确保结果的有效性，这项测试还遵循了 OpenAI 的数据去污方法，更关键的是没有发现数据污染的证据。如果你细细查看图中的模型，发现只要带有「rephraser」这个单词...

大数据 2023-11-18 人工智能

429阅读

解决LLaMA、BERT等部署难题：首个4-bit浮点量化LLM来了

大语言模型 (LLM 压缩一直备受关注，后训练量化（Post-training Quantization 是其中一种常用算法，但是现有 PTQ 方法大多数都是 integer 量化，且当比特数低于 8 时，量化后模型的准确率会下降非常多。想较于 In...

生成式AI 2023-11-17 人工智能

449阅读

OpenAI CEO和马斯克在线互怼：Grok真能叫板GPT-4吗？

最近，科技界的两大顶流——OpenAI CEO和马斯克“掐”起来了。事情的起因是，Sam Altman发了一条推文，说“GPTs可以节省很多工作”，配图充满嘲讽意味，直指马斯克的AI聊天机器人Grok。他让GPT Builder创建一个聊天机器人，以...

人工智能 2023-11-17 人工智能

536阅读

【NLP】Llama & Alpaca大模型

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

生成式AI 2023-11-17 人工智能

466阅读

AIGC：使用bert_vits2实现栩栩如生的个性化语音克隆

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型，...

AIGC 2023-11-17 人工智能

962阅读

如何有效减少 AI 模型的数据中心能源消耗？

在让人工智能变得更好的竞赛中，麻省理工学院（MIT）林肯实验室正在开发降低功耗、高效训练和透明能源使用的方法。在 Google 上搜索航班时，您可能已经注意到，现在每个航班的碳排放量估算值都显示在其成本旁边。这是一种告知客户其对环境影响的方式，并让他...

AIGC 2023-11-16 人工智能

512阅读

AIGC入门 - LLM 信息概览

在阅读本文之前，建议阅读文章：《GPT，GPT-2，GPT-3，InstructGPT的进化之路》本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...

大数据 2023-11-16 人工智能

617阅读

Ghostbuster：一个准确度高的AI生成文本检测工具

大语言模型如ChatGPT，以其卓越的写作能力引发了问题。学生们纷纷利用这些模型代写作业，导致一些学校不得不采取禁止ChatGPT的措施。此外，这些模型还存在生成带有事实错误的文本的倾向，因此谨慎的读者可能想知道，在信任某些新闻文章或其他来源之前，是否有生...

生成式AI 2023-11-15 人工智能

469阅读

未来AI将有五大发展趋势?2024年将进入“有意义的人工智能时代”

由于生成式人工智能的出现，人们与人工智能的距离逐渐缩短。过去很少关注相关技术的人们，今年可能已经成为人工智能工具的用户。眼看着2023年即将结束，新的一年里，人工智能会有怎样的发展呢? 企业将通过开源模型提升人工智能能力美国研究公司Forrester...

AIGC 2023-11-14 人工智能

459阅读

网易云音乐推荐系统的冷启动技术

一、问题背景：冷启动建模的必要性和重要性作为一个内容平台，云音乐每天都会有大量的新内容上线，虽然相较于短视频等其它平台，云音乐平台的新内容数量相对较少，但实际数量可能远远超出大家的想象。同时，音乐内容与短视频、新闻、商品推荐又有着显著的不同，音乐的...

大数据 2023-11-14 人工智能

665阅读

全球各行业公司纷纷发布GPT-4相关职位

大型语言模型（LLM）领域正在迅速增长，对深度学习、机器学习、自然语言处理(NLP 等领域的专业人才需求不断上升。随着越来越多的公司采用聊天机器人和其他LLM人工智能技术来提高客户服务和运营效率，对于开发、维护和操作这些系统的才华横溢的个体的需求也在增加。...

大数据 2023-11-13 人工智能

454阅读

Text-to-SQL小白入门（五）开源最强代码大模型Code Llama

摘要本文介绍了Code Llama大模型的基本概括，包含了论文的摘要、结果、结论以及核心方法，对于了解和实践Code Llama有一定帮助。论文概述上一篇介绍了指令进化大模型WizardLM，留了一个坑，补上Code Llama论文学习，...

大数据 2023-11-12 人工智能

640阅读

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora（部分）

文章目录 LLaMA大模型及其衍生模型 1. LLaMA 2. stanford_alpaca 3. ChatDoctor 4. alpaca-lora 5. Chinese-LLaMA-Alpaca 6. BELLE 大模型综述 A Su...

生成式AI 2023-11-12 人工智能

756阅读

NLP-分词器：SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】

背景随着ChatGPT迅速出圈，最近几个月开源的大模型也是遍地开花。目前，开源的大语言模型主要有三大类：ChatGLM衍生的大模型（wenda、ChatSQL等）、LLaMA衍生的大模型（Alpaca、Vicuna、BELLE、Phoenix、Chim...

生成式AI 2023-11-11 人工智能

969阅读

如何用AI制作电影级镜头？Midjourney v5体验教程(附prompts大全)

目录 1 AI绘画不断进步 2 Midjourney体验教程 2.1 注册Discord账号 2.2 Midjourney绑定Discord 2.3 接入Midjourney Bot应用 2.4 开始作画 3 prompts大全 4 结语...

生成式AI 2023-11-10 人工智能

593阅读

【AIGC】1、爆火的 AIGC 到底是什么 | 全面介绍

文章目录一、AIGC 的简要介绍二、AIGC 的发展历程三、AIGC 的基石 3.1 基本模型 3.2 基于人类反馈的强化学习 3.3 算力支持四、生成式 AI（Generative AI） 4.1 单模态 4.1.1 生成式语...

AIGC 2023-11-09 人工智能

606阅读

Meta最新模型LLaMA细节与代码详解

Meta最新模型LLaMA细节与代码详解 0. 简介 1. 项目环境依赖 2. 模型细节 2.1 RMS Pre-Norm 2.2 SwiGLU激活函数 2.3 RoPE旋转位置编码 3. 代码解读 3.1 tokenizer 3.2 m...

人工智能 2023-11-09 人工智能

536阅读

北大具身智能团队提出需求驱动导航，对齐人类需求，让机器人更高效

如果想让机器人帮助你，你通常需要下达一个较为精准的指令，但指令在实际中的实现效果不一定理想。如果考虑真实环境，当要求机器人找某个特定的物品时，这个物品不一定真的存在当前的环境内，机器人无论如何也找不到；但是环境当中是不是可能存在一个其他物品，它和用户要求...

生成式AI 2023-11-09 人工智能

447阅读

LLM - LLaMA-2 获取文本向量并计算 Cos 相似度

目录一.引言二.获取文本向量 1.hidden_states 与 last_hidden_states ◆ hidden_states ◆ last_hidden_states 2.LLaMA-2 获取 hidden_states ◆...

人工智能 2023-11-08 人工智能

966阅读

小白也能看懂的 AUC 详解

简介上篇文章小白也能看懂的 ROC 曲线详解介绍了 ROC 曲线。本文介绍 AUC。AUC 的全名为Area Under the ROC Curve，即 ROC 曲线下的面积，最大为 1。根据 ROC 和 AUC 的关系，我们可以得到如下结...

AIGC 2023-11-08 人工智能

399阅读