评估指标第3页 - AIGC资讯

网络安全人士必知的AI专业术语

随着人工智能的迅猛发展，我们正置身于第四次工业革命的浪潮中。在这个数字化的时代，网络安全成为各行业至关重要的议题。作为网络安全从业人员，不仅需要熟练掌握传统安全领域的知识，更需要深刻理解和运用人工智能，以在风云变幻的网络战场中保护信息资产。人工智能不仅为...

大数据 2024-01-22 人工智能

671阅读

LLaMA Pro: Progressive LLaMA with Block Expansion

Q: 这篇论文试图解决什么问题？ A: 这篇论文试图解决大型语言模型（LLMs）在特定领域（如编程、数学、生物医学或金融）能力不足的问题。尽管LLMs在多种现实世界任务中表现出色，但在某些特定领域仍然存在局限性，这阻碍了开发通用语言代理以应用于更广泛场景...

生成式AI 2024-01-18 人工智能

612阅读

AIGC新岗位新机会解析；GPTs万字教程；28套提示词让人物情绪饱满；爆款AI搜索引擎RAG实践分享；AI独立创始人成长手册；LangChain年度洞察 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 北京互联网法院审理全国首例「AI声音侵权案」，五被告都否认侵权补充一份背景：点击了解事件说明与当前进展 ⋙ AI生成图片著作权侵权第一案、...

AIGC 2024-01-18 人工智能

489阅读

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时，我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识，...

AIGC 2024-01-18 人工智能

709阅读

「文生图」再升级！学习个性化参照，无限生成多样图片，轻松设计玩具建筑

最近，来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。这种方法可以让任何基于文字提示的生成模型（比如文生图、文生3D等），通过一组参照图片来学习对应的视觉属性共性和变化的文本提示分布。...

生成式AI 2024-01-16 人工智能

596阅读

超越BEVFusion！又快又好的极简BEV融合部署方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在算法开发中，激光雷达-相机3D目标检测遇到了过度拟合问题，这是由于违反了一些基本规则。在数据集构建的数据标注方面，本文参考了理论补充，并认为回归任务预测不应涉及来自...

大数据 2024-01-16 人工智能

637阅读

OpenAI Whisper论文笔记

OpenAI Whisper论文笔记 OpenAI 收集了 68 万小时的有标签的语音数据，通过多任务、多语言的方式训练了一个 seq2seq （语音到文本）的 Transformer 模型，自动语音识别（ASR）能力达到商用水准。本文为李沐老师论文精...

人工智能 2024-01-15 人工智能

494阅读

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

741阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

730阅读

百度沈抖：做好AI原生应用，两个步骤至关重要

2024年1月10日，在荣耀MagicOS 8.0发布会及开发者大会上，荣耀终端有限公司CEO赵明宣布了“百模生态计划”，并与百度集团执行副总裁、百度智能云事业群总裁沈抖共同宣布，百度智能云成为荣耀大模型生态战略合作伙伴。沈抖在现场演讲中表示，“端云协...

AIGC 2024-01-14 人工智能

430阅读

蚂蚁营销推荐场景上的因果纠偏方法

一、因果纠偏的背景 1、偏差的产生推荐系统里根据收集的数据来训练推荐模型，给用户推荐一个合适的 item，当用户与这个 item 产生交互后，数据又会被收集用于继续训练模型，从而形成一个闭环。但是这个闭环当中可能会存在各种各样的影响因素，因此会产生误差...

生成式AI 2024-01-09 人工智能

513阅读

只需1080ti，即可在遥感图像中对目标进行像素级定位！代码数据集已开源！

太长不看版这篇论文介绍了一项新的任务 —— 指向性遥感图像分割（RRSIS），以及一种新的方法 —— 旋转多尺度交互网络（RMSIN）。RRSIS 旨在根据文本描述实现遥感图像中目标对象的像素级定位。为了解决现有数据集规模和范围的限制，本文构建了一个新...

大数据 2024-01-06 人工智能

499阅读

AIGC（生成式AI）试用 6 -- 从简单到复杂

从简单到复杂，这样的一个用例该如何设计？之前浅尝试用，每次尝试也都是由浅至深、由简单到复杂。一点点的“喂”给生成式AI主题，以测试和验证生成式AI的反馈。 AIGC（生成式AI）试用 1 -- 基本文本_Rolei_...

AIGC 2024-01-06 人工智能

554阅读

pytorch快速训练ai作画模型的python代码

在 PyTorch 中训练 AI 作画模型的基本步骤如下: 准备数据集: 需要准备一个包含许多图像的数据集, 这些图像可以是手绘的或者是真实的图像. 定义模型: 选择一个适当的深度学习模型, 并使用 PyTorch 定义该模型. 例如...

人工智能 2024-01-05 人工智能

567阅读

端到端的自动驾驶会取代Apollo、autoware这类框架吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位：百度作者：共一 Jian...

人工智能 2024-01-04 人工智能

487阅读

数据闭环！DrivingGaussian：逼真环视数据，驾驶场景重建SOTA

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解北大王选计算机研究所的最新工作，提出了DrivingGaussian，一个高效、有效的动态自动驾驶场景框架。对于具有移动目标的复杂场景，首先使用增量静态3D高斯对整个...

生成式AI 2023-12-28 人工智能

542阅读

一文读懂分类模型评估指标

模型评估是深度学习和机器学习中非常重要的一部分，用于衡量模型的性能和效果。本文将逐步分解混淆矩阵，准确性，精度，召回率和F1分数。混淆矩阵混淆矩阵是在分类问题中用于评估模型性能的表格，它展示了模型对样本的分类情况。混淆矩阵的行表示实际类别，列表示预...

AIGC 2023-12-27 人工智能

532阅读

ocr识别原理和场景应用浅析

Labs 导读日常生活的截图提取、拍照搜题，都用到了文字识别领域占据重要地位的OCR（光学字符识别）技术。 Part 01、什么是OCR OCR（光学字符识别）是计算机文字识别的一种方法，利用光学技术和计算机技术将印刷或手写在纸张等介质的文...

生成式AI 2023-12-25 人工智能

749阅读

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

Paper name LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Paper Reading Note Paper URL: htt...

人工智能 2023-12-25 人工智能

487阅读

清华特奖焦剑涛大模型创业：突破GPT-4工具使用能力，搞开源种子轮融资七千万

两位清华校友打造，在GPT-4核心优势之一使用工具上实现超越。连HuggingFace CEO都来帮它造势：它的名字叫“NexusRaven”，参数只有130亿。出色的函数调用能力连网友都忍不住称赞，既可以并行也可以嵌套。背后团队则更令人瞩目...

AIGC 2023-12-24 人工智能

483阅读

4090成A100平替？token生成速度只比A100低18%，上交大推理引擎火了

不仅如此，PowerInfer 与最先进的本地LLM推理框架 llama.cpp 相比，在单个 RTX 4090 (24G 上运行 Falcon (ReLU -40B-FP16，实现了 11 倍多的加速，还能保持模型的准确性。具体来说，PowerIn...

大数据 2023-12-22 人工智能

558阅读

MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT

MosaicML正在推出其第二个开源大型语言模型（LLM），称为MPT-30B，这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义，我采访了MosaicML联合创始人兼首席执行官Naveen Rao。他之前的创业公司是...

生成式AI 2023-12-20 人工智能

483阅读

深度学习之目标检测中的常用算法

随着深度学习的不断发展，深度卷积神经网络在目标检测领域中的应用愈加广泛，现已被应用于农业、交通和医学等众多领域。与基于特征的传统手工方法相比，基于深度学习的目标检测方法可以学习低级和高级图像特征，有更好的检测精度和泛化能力。什么是目标检测？目标检测...

AIGC 2023-12-19 人工智能

903阅读

python训练ai作画的代码

你可以使用 Python 来训练一个 AI 来进行绘画。这里是一个基本的代码示例： ``` import tensorflow as tf 定义输入和输出的占位符 inputs = tf.placeholder(shape=...

AIGC 2023-12-14 人工智能

582阅读

24 LLM错误代码补全：机器学习顶会NeurIPS‘23 智能体评估：自行构建数据集Buggy-HumanEval、Buggy-FixEval+错误代码补全+修复模型【网安AIGC专题11.22】

Large Language Models of Code Fail at Completing Code with Potential Bugs 写在最前面论文名片对于命名实体识别、关系抽取任务的启发课堂讨论实验自己构建的数据集...

人工智能 2023-12-14 人工智能

537阅读

RayDF：实时渲染！基于射线的三维重建新方法

本文经自动驾驶之心公众号授权转载，转载请联系出处。图片论文链接：https://arxiv.org/pdf/2310.19629 代码链接：https://github.com/vLAR-group/RayDF 主页：https://vlar-gro...

AIGC 2023-12-13 人工智能

544阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...

人工智能 2023-12-13 人工智能

435阅读

夸张！EMNLP投稿近5000篇，奖项出炉：北大、腾讯摘最佳长论文

EMNLP 是自然语言处理领域的顶级会议之一，EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。因为今年 ChatGPT 的爆火带动大模型、NLP 概念，EMNLP 2023 的投稿论文数量也达到近 5000 篇，甚至略高于 AC...

生成式AI 2023-12-11 人工智能

517阅读

北大等发布最新AI智能体Jarvis-1，制霸「我的世界」

智能体研究又取得了新成绩！最近，来自北大、北邮、UCLA和BIGAI的研究团队联合发表了一篇论文，介绍了一个叫做Jarvis-1的智能体。论文地址：https://arxiv.org/pdf/2311.05997.pdf 从论文标题来看，Jarvi...

AIGC 2023-12-08 人工智能

455阅读

机器学习 - 混淆矩阵：技术与实战全方位解析

本文深入探讨了机器学习中的混淆矩阵概念，包括其数学原理、Python实现，以及在实际应用中的重要性。我们通过一个肺癌诊断的实例来演示如何使用混淆矩阵进行模型评估，并提出了多个独特的技术洞见。文章旨在为读者提供全面而深入的理解，从基础到高级应用。...

AIGC 2023-12-04 人工智能

618阅读

AI测试｜史上最全，细数AIGC在测试领域落地的困难点

一、引言&背景自2022年由横空出世的ChatGPT引发的各类AIGC（Generative AI）爆发以来，人们对其在各个领域的应用潜力产生了极大的兴趣。在研发领域，各种研究已经证明了Github Copilot在研发效能提高上的积极作用。...

AIGC 2023-11-29 人工智能

1007阅读

AIGC之GPT-4：GPT-4的简介与详细攻略

AIGC之GPT-4：GPT-4的简介与详细攻略简介欢迎来到人工智能生成内容（AIGC）时代的新篇章！本篇博客将介绍GPT-4（Generative Pre-trained Transformer 4）的核心原理、意义、亮点、技术点、缺点以及使...

人工智能 2023-11-28 人工智能

816阅读

六个常用的聚类评价指标

评估聚类结果的有效性，即聚类评估或验证，对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类，还可以用来确定哪种聚类算法最适合特定的数据集和任务，并调优这些算法的超参数(例如k-means中的聚类数量，或DBSCAN中的密度参数 ...

人工智能 2023-11-26 人工智能

466阅读

GPT成熟之路官方笔记 | OpenAI开发者日

ChatGPT产品打造的细节，现在OpenAI自己交了个底。并且这波干货分享真是信息量满满，包括但不限于： ChatGPT背后的产品和研发团队如何协作大模型应用如何从原型走向成熟 OpenAI如何优化大模型性能…… 以上信息，依然来自今年的新晋...

人工智能 2023-11-26 人工智能

494阅读

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

大型语言模型（LLM）已经是许多自然语言处理任务的强大工具，只要能给出正确的提示。然而，由于模型的敏感性，找到最优提示通常需要进行大量手动尝试和试错努力。此外，一旦将初始提示部署到生产环境中，可能会出现意想不到的边缘情况，需要更多轮的手动调整来进一步完善...

生成式AI 2023-11-26 人工智能

516阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数...

大数据 2023-11-26 人工智能

582阅读

大模型之Bloom&LLAMA----Pre-Training(二次预训练)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

生成式AI 2023-11-25 人工智能

617阅读

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架)的简介、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架的简介、安装、案例实战应用之详细攻略导读：2023年07月31日，哈工大讯飞联合实验室，发布Chinese-LLaMA-Alpaca-2，本项目基于Meta发布的...

大数据 2023-11-25 人工智能

919阅读

【网安AIGC专题11.1】11 Coreset-C 主动学习：特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)

Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面论文名片先验知识的补充主动学习采样函数 benchmark基准和base...

大数据 2023-11-25 人工智能

565阅读

历数5年89篇研究，这篇综述告诉我们深度学习中的代码数据增强怎么样了

当今深度学习以及大模型的飞速发展，带来了对创新技术的不断追求。在这一进程中，代码数据增强技术显现出其不可忽视的价值。最近，由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调...

大数据 2023-11-23 人工智能

489阅读

聊一聊高精地图的数据问题，无图感知还有哪些坑要踩？

本文经自动驾驶之心公众号授权转载，转载请联系出处。在自动驾驶领域，高精地图在定位、规划和避碰等方面发挥着至关重要的作用，实现行车安全和高质量路线预测。然而高精地图的构建都是昂贵、复杂的，而且专业性很强，无论是在硬件组成还是软件及其所使用的算法方面。...

生成式AI 2023-11-23 人工智能

606阅读

AIGC繁花，绽放在精耕的算力土壤之上

2023年的春天，称得上一句AI之春。大模型成为技术力量新的爆发点，生成式AI（AIGC）应用风起云涌。产业界争先恐后训大模型之际，广大用户最大的困惑是——发布了，但就是玩不到啊！ OpenAI有地域限制且不去说它，各种国产大模型也很...

AIGC 2023-11-22 人工智能

498阅读

中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT

中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型（LLM）。该模型基于封神榜团队的 Ziya2-13B 模型构建，拥有130亿个参数，并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...

生成式AI 2023-11-20 人工智能

537阅读

基于LLaMA却改张量名，李开复公司大模型引争议，官方回应来了

前段时间，开源大模型领域迎来了一个新的模型 —— 上下文窗口大小突破 200k，能一次处理 40 万汉字的「Yi」。这个大模型由创新工场董事长兼 CE0 李开复创立的大模型公司「零一万物」构建，包括了 Yi-6B 和 Yi-34B 两个版本。根据 H...

生成式AI 2023-11-14 人工智能

446阅读

自动代码Copilot背后的模型

文章目录 1.引入 2.评估框架 3.评估数据集 4.模型方法 5.实验结果 6.总结 7.参考之前，我已经介绍过Github发布的自动代码Copilot的使用方法，感兴趣的可以看这篇文章：Copilot要收费了？今天主要介绍一...

AIGC 2023-11-13 人工智能

653阅读

解锁 PaddleOCR 的超能力

光学字符识别（OCR）是一项强大的技术，使机器能够从图像或扫描文档中识别和提取文本。OCR 在各个领域都有应用，包括文件数字化、从图像中提取文本以及基于文本的数据分析。在本文中，我们将探讨如何使用 PaddleOCR，一款基于深度学习的先进OCR工具包，...

生成式AI 2023-11-12 人工智能

535阅读

【人工智能】ChatGTP从入门到精通

当谈论自然语言处理和文本生成技术时，Chat GPT 是一个备受瞩目的话题。作为一种基于深度学习的语言模型，Chat GPT 在近几年里已经展现出了惊人的能力，可以生成几乎无法区分与人类写作的文本，并在自然语言处理领域的各种任务中都表现出色。Chat GP...

生成式AI 2023-11-12 人工智能

893阅读

LLM - LLaMA-2 获取文本向量并计算 Cos 相似度

目录一.引言二.获取文本向量 1.hidden_states 与 last_hidden_states ◆ hidden_states ◆ last_hidden_states 2.LLaMA-2 获取 hidden_states ◆...

人工智能 2023-11-08 人工智能

1017阅读

强化学习与多任务推荐

一、短视频推荐两阶段约束强化学习算法首先介绍的一项快手自研的 WWW 2023 Research Track 工作，主要解决短视频推荐场景下的带约束多目标优化问题。在短视频推荐单列场景中，用户通过上下滑形式和系统进行交互，观看多个视频。用户对每个...

人工智能 2023-11-07 人工智能

631阅读