训练数据第30页

手机被“秒解锁”？活体检测+3D人脸识别让刷脸更安全

如今，人们使用智能手机进行刷脸解锁、刷脸支付就像吃饭喝水一样自然。人脸识别技术的进步为人们的日常生活带来了诸多便利，但同时也引发了隐私安全问题。近日，来自清华的 Real AI（瑞莱智慧）展示了一项简单的攻击技术：测试者佩戴了一副含有对抗样本图案的眼镜...

生成式AI 2023-11-08 大数据

855阅读

openGauss数据库源码解析系列文章—— AI技术之“指标采集、预测与异常检测”

上一篇介绍了“8.4 智能索引推荐”的相关内容，本篇我们介绍“8.5 指标采集、预测与异常检测”的相关精彩内容介绍。 8.5 指标采集、预测与异常检测数据库指标监控与异常检测技术，通过监控数据库指标，并基于时序预测和异常检测等算法，发现异常信息...

人工智能 2023-11-08 大数据

920阅读

关于世界模型的一点迷思，以及与自动驾驶结合的几点思考~

本文经自动驾驶之心公众号授权转载，转载请联系出处。什么是world models? 什么是world models, 可以参考Yann LeCun的PPT解释即输入历史1到t时刻的状态信息, 结合当前的动作, 能够预测接下来的状态。通俗地理解,...

AIGC 2023-11-08 人工智能

1270阅读

生成式AI喧嚣之下：CIO选择谨慎行事尚未全力投入

大多数CIO已经开始探索生成式AI，以确保他们跟上发展步伐，但很多人发现市场上的技术尚未达到宣传的效果。米其林全球首席信息官Yves Caseau表示：“在对GitHub copilot和ChatGPT进行了六个多月的试验后，我对生成式AI的发展速度感...

AIGC 2023-11-07 人工智能

895阅读

德国初创公司 Aleph Alpha 完成 5 亿美元 B 轮融资，挑战 OpenAI

德国初创公司 Aleph Alpha 在周一宣布，已完成由博世、SAP 和惠普企业等支持的 5 亿美元融资。这家公司构建了自己的大型语言模型，并在 B 轮融资中筹集了这笔新资金，这是该公司的第二轮主要融资，也是一笔不同寻常的巨额 B 轮投资。这轮融资主...

AIGC 2023-11-07 人工智能

840阅读

想快速进入人工智能领域的Java程序员？你准备好了吗？

引言今天我们来探讨一下作为Java程序员，如何迅速融入人工智能的领域。，当前有一些流行的LLMs选择，例如ChatGPT、科大讯飞的星火、通义千问和文心一言等。如果你还没有尝试过这些工具，那么现在也不失为一个很好的机会，赶快体验一下吧。这些工具不仅能够...

人工智能 2023-11-07 人工智能

934阅读

OpenAI 跟进推出版权保护计划：承诺保护客户应对版权侵权诉讼

在业界的期待和社会各界的关注中，OpenAI 今日正式宣布推出新的版权保护计划——版权屏障（Copyright Shield）。通过该计划，OpenAI 将介入并为使用其产品的企业提供版权侵权辩护，特别是针对 OpenAI 开发者平台的「普遍可用」功能以及...

AIGC 2023-11-07 人工智能

803阅读

让大模型忘记哈利波特，微软新研究上演Llama 2记忆消除术，真·用魔法打败魔法（doge）

最近微软一项研究让Llama 2选择性失忆了，把哈利波特忘得一干二净。现在问模型“哈利波特是谁？”，它的回答是这样婶儿的：木有赫敏、罗恩，木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的，比如给它一个看似非常普通的提示“那年秋天，哈...

人工智能 2023-11-07 人工智能

754阅读

交叉验证太重要了！

首先需要搞明白，为什么需要交叉验证？交叉验证是机器学习和统计学中常用的一种技术，用于评估预测模型的性能和泛化能力，特别是在数据有限或评估模型对新的未见数据的泛化能力时，交叉验证非常有价值。那么具体在什么情况下会使用交叉验证呢？模型性能评估：交叉...

人工智能 2023-11-06 人工智能

915阅读

AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

????大模型动态李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。项目地址:htt...

AIGC 2023-11-06 人工智能

932阅读

大型语言模型（LLM）技术精要，不看亏了

哈喽，大家好。今天分享一篇知乎高赞文章，作者是张俊林老师。图片读完收获很多，能帮大家更好地理解、学习大模型。原文有2.8w字，我提炼了核心要点，阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型（LLM）...

AIGC 2023-11-06 人工智能

965阅读

人工智能如何改变城市景观

人工智能(AI 和深度学习无处不在，如今它们具有重塑城市景观的潜力。分析景观图像的深度学习模型可以帮助城市规划者可视化重建计划，以提高美观度并防止代价高昂的错误。然而，为了使这些模型有效，它们需要准确地识别和分类图像中的元素，这是一个称为实例分割的挑战...

AIGC 2023-11-06 人工智能

857阅读

马斯克xAI公布大模型详细进展，Grok只训练了2个月

近几日，马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ，直接把网友的好奇心拉满。和总是一本正经回答问题的 ChatGPT 不同，Grok 自带幽默和嘲讽技能。就像下图所展示的，Grok 在被...

AIGC 2023-11-06 人工智能

899阅读

谷歌DeepMind力证：GPT-4终局是人类智慧总和！Transformer模型无法超越训练数据进行泛化

Transformer模型是否能够超越预训练数据范围，泛化出新的认知和能力，一直是学界争议已久的问题。最近谷歌DeepMind的3位研究研究人员认为，要求模型在超出预训练数据范围之外泛化出解决新问题的能力，几乎是不可能的。 LLM的终局就是人类智慧总和...

AIGC 2023-11-06 人工智能

790阅读

元象XVERSE开源650亿参数通用大模型XVERSE-65B

元象XVERSE宣布开源650亿参数高性能通用大模型XVERSE-65B，无条件免费商用。 XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构，参数规模达到了650亿。模型通过训练了2....

人工智能 2023-11-06 人工智能

835阅读

北大具身智能新成果：无需训练，听指令就能灵活走位

北京大学董豪团队具身导航最新成果来了：无需额外建图和训练，只需说出导航指令，如： Walk forward across the room and walk through the panty followed by the kitchen. Stan...

人工智能 2023-11-06 人工智能

912阅读

国内最大开源模型发布，无条件免费商用！参数650亿，基于2.6万亿token训练

国内规模最大的开源大模型来了：参数650亿、基于2.6-3.2万亿token训练。排名仅次于“猎鹰”和“羊驼”，性能媲美GPT3.5，现在就能无条件免费商用。它就是来自深圳元象公司的XVERSE。根据算力、资源限制和具体任务需求的不同，我们能对...

人工智能 2023-11-06 人工智能

851阅读

Together AI发布RedPajama v2：包内30万亿token数据集，用于训练大型语言模型

Together AI最近发布了RedPajama v2，这是一个庞大的在线数据集，包含了30万亿token，成为目前公开可用的最大数据集之一，专门用于学习型机器学习系统的培训。对于像Llama、Mistral、Falcon、MPT和RedPajama等...

人工智能 2023-11-06 人工智能

957阅读

全球首发！总结七十余种开源数据集，一览自动驾驶开源数据体系

本文经自动驾驶之心公众号授权转载，转载请联系出处。基于数据驱动的各类深度学习模型任务，近年来随着数据集规模的不断扩大，性能逐渐被提升，国内外各大自动驾驶公司都在不断建立自己的数据库，以及数据闭环系统，期待数据的丰富能够解决下半场自动驾驶问题，那么如何...

AIGC 2023-11-06 人工智能

912阅读

ChatGPT新功能曝光！OpenAI首届开发者大会抢先看

OpenAI将于太平洋时间11月6日早上10点举办首届全球开发者大会（大约北京时间11月7日凌晨2点），与来自世界各地的开发者、企业、技术合作伙伴，分享OpenAI最新产品和技术趋势。由于OpenAI的金字招牌太响，已经有不少人迫不及待地曝光其开发者大会...

人工智能 2023-11-06 人工智能

899阅读

什么是机器学习中的正则化？

1. 引言在机器学习领域中，相关模型可能会在训练过程中变得过拟合和欠拟合。为了防止这种情况的发生，我们在机器学习中使用正则化操作来适当地让模型拟合在我们的测试集上。一般来说，正则化操作通过降低过拟合和欠拟合的可能性来帮助大家获得最佳模型。在本文...

AIGC 2023-11-06 人工智能

851阅读

一篇学会大模型浪潮下的时间序列预测

今天跟大家聊一聊大模型在时间序列预测中的应用。随着大模型在NLP领域的发展，越来越多的工作尝试将大模型应用到时间序列预测领域中。这篇文章介绍了大模型应用到时间序列预测的主要方法，并汇总了近期相关的一些工作，帮助大家理解大模型时代时间序列预测的研究方法。...

人工智能 2023-11-06 人工智能

871阅读

大模型落地最后一公里：111页全面综述大模型评测

当前，大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命，众多科技巨头纷纷围绕大模型进行布局，进一步推动大模型不断向前发展。然而，尽管大模型能够协助我们完成各种任务，改变我们的生产和生活的方式，提高生产力，为我们带来便利，但大模型的发展也伴随着诸多...

人工智能 2023-11-05 人工智能

949阅读

人工智能进入强监管时代

以ChatGPT为代表的基于LLM(大语言模型的生成式人工智能应用正风靡全球，各行各业都在争先恐后将其集成到前端和后端的各种系统中，与此同时生成式人工智能面临的安全风险也正随着其热度上升而凸显。生成式人工智能自身正面临提示注入等多种攻击，很可能给企...

AIGC 2023-11-03 人工智能

844阅读

AI生图太诡异？马里兰&NYU合力解剖神经网络，CLIP模型神经元形似骷髅头

AI黑盒如何才能解？神经网络模型在训练的时，会有些ReLU节点「死亡」，也就是永远输出0，不再有用。它们往往会被被删除或者忽略。恰好赶上了模糊了生与死的界限的节日——万圣节，所以这是探索那些「死节点」的好时机。对于大多数图像生成模型来说，会输出正...

人工智能 2023-11-03 人工智能

881阅读

科普神文，一次性讲透AI大模型的核心概念

图片令牌，向量，嵌入，注意力，这些AI大模型名词是否一直让你感觉熟悉又陌生，如果答案肯定的话，那么朋友，今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段，为你由浅入深一次性讲透AI大模型的核心概念。引言随着科技公司及国际竞争的不断推进，...

人工智能 2023-11-03 人工智能

1304阅读

大模型: 模型大了难在哪里？

大家好，我是Tim。自从GPT模型诞生以来，其参数规模就在不停的扩大。但模型并非简单的直接变大，需要在数据、调度、并行计算、算法和机器资源上做相应的改变。今天就来总结下，什么是大模型，模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...

人工智能 2023-11-03 人工智能

1633阅读

使用Ray创建高效的深度学习数据管道

用于训练深度学习模型的GPU功能强大但价格昂贵。为了有效利用GPU，开发者需要一个高效的数据管道，以便在GPU准备好计算下一个训练步骤时尽快将数据传输到GPU。使用Ray可以大大提高数据管道的效率。 1、训练数据管道的结构首先考虑下面的模型训练伪代码。...

AIGC 2023-11-02 人工智能

985阅读

目前CIO们仍在谨慎地探索GenAI在企业中的应用价值

多数CIO已经开始探索GenAI，以确保企业跟上技术发展的趋势，但许多人发现，市场上的技术还没有达到理想的水平。米其林全球CIO Yves Caseau表示：“在对GitHub Copilot和ChatGPT进行了六个多月的试验后，GenAI的发展速度令...

AIGC 2023-11-02 人工智能

866阅读

姚班斯隆奖马腾宇正式宣布大模型创业

清华姚班校友兼斯坦福大学助理教授马腾宇宣布了一个引人注目的创业项目，名为Voyage，旨在提供卓越的嵌入模型。这个嵌入模型在MTEB数据集上表现超越OpenAI，成为SOTA。该项目的成功也得益于三位知名教授，包括斯坦福人工智能实验室主任Christoph...

人工智能 2023-11-01 人工智能

941阅读

独家 | GPT-4、Midjourney之外，谭平创业团队要造一个3D基础模型

前段时间，OpenAI 发布了文生图模型 DALL・E3，生成效果非常惊艳。比如，你可以让它一次画出几十个物体，然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到，DALL・E3不仅画出了足量的物体，就连冲浪者面对重压时的神情都刻画了出来。但细心...

AIGC 2023-10-31 人工智能

953阅读

AI编程，详细比较GitHub Copilot对比Amazon CodeWhisperer

1、简介 GitHub Copilot和Amazon CodeWhisperer是采用人工智能技术驱动的编码助手，它们将自动完成编码功能提升到一个全新的水平。在最佳状态下，它们可以根据开发者提供的简短描述性文本编写功能完整、可运行的代码块。这可以让开发者...

AIGC 2023-10-31 人工智能

1583阅读

通义千问2.0将带来重磅升级通义千问app怎么注册下载安装

通义千问2.0将带来重磅升级，正式超越GPT-3.5，正在加速追赶GPT-4，成为业界的佼佼者。此次升级的核心在于其在性能上的巨大飞跃，不仅在复杂指令理解、文学创作、通用数学、知识记忆等方面有显著提升，还在幻觉抵御等能力上表现出色。通义千问2.0将带来...

人工智能 2023-10-31 人工智能

1110阅读

GPT-4、Midjourney之外，谭平创业团队要造一个3D基础模型

前段时间，OpenAI 发布了文生图模型 DALL・E 3，生成效果非常惊艳。比如，你可以让它一次画出几十个物体，然后再要求它把这些物体全部放到一个冲浪者的背上：可以看到，DALL・E 3 不仅画出了足量的物体，就连冲浪者面对重压时的神情都刻画了...

AIGC 2023-10-31 人工智能

876阅读

Meta AI研究负责人倡导开源许可制度变革

Meta公司最近发布的大型语言模型Llama2备受争议，因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费，但在开源软件领域，一些人仍对该公司的开放性持有异议。具体来说，Meta公司的许可协议使Llama2对许多人免费，但它仍然是有限的，...

人工智能 2023-10-31 人工智能

925阅读

ChatGPT、Llama-2等大模型，能推算出你的隐私数据！

ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据，就能推算出你的住址、年龄、性别、职业、收入等隐私数据。瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit（知名论坛）用户的个人资料真实数据集PersonalReddi...

人工智能 2023-10-31 人工智能

851阅读

生成式AI迫使Stack Overflow裁员28%

作者丨Anirban Ghoshal 编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）面向开发人员的问答门户网站Stack Overflow将裁员近三分之一，取而代之的是生成式人工智能驱动的编程助手，比如微软的...

人工智能 2023-10-30 人工智能

837阅读

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型（Multimodal Large Language Models, MLLMs）的一个典型问题。简单来说就是：模型输出的描述与图片内容不相符。下图中体现了两种幻觉，红色部分错误地描述了狗的颜色（属性幻觉），蓝色部分描...

AIGC 2023-10-30 人工智能

1116阅读

Agent 应用于提示工程

如果Agent模仿了人类在现实世界中的操作方式，那么，能否应用于提示工程即Prompt Engingeering 呢？从LLM到Prompt Engineering 大型语言模型(LLM 是一种基于Transformer的模型，已经在一个巨大的语料库或...

人工智能 2023-10-30 人工智能

1110阅读

AI智能超越人类终解开！李飞飞高徒新作破圈，5万个合成数据碾压人类示例，备咖啡动作超丝滑

AI巨佬Geoffrey Hinton称，「科技公司们正在未来18个月内，要使用比现在GPT-4多100倍的算力训练新模型」。更大参数的模型，对算力需求巨大的同时，对数据也提出了更高的要求。但是，更多的高质量数据该从何来？英伟达高级科学家Jim F...

AIGC 2023-10-30 人工智能

888阅读

首个人体动捕基模型面世！SMPLer-X：横扫七大榜单

人体全身姿态与体型估计（EHPS, Expressive Human Pose and Shape estimation）虽然目前已经取得了非常大研究进展，但当下最先进的方法仍然受限于有限的训练数据集。最近，来自南洋理工大学S-Lab、商汤科技、上海人...

AIGC 2023-10-29 人工智能

871阅读

最好7B模型再易主！打败700亿LLaMA2，苹果电脑就能跑

花500刀“调教”的70亿参数模型，打败700亿参数的Llama 2！且笔记本就能轻松跑，效果媲美ChatGPT。重点：免费、不要钱。 HuggingFace H4团队打造的开源模型Zephyr-7B，鲨疯了。其底层模型是前段时间爆火、由有着“欧...

AIGC 2023-10-29 人工智能

1159阅读

小模型如何比肩大模型，北理工发布明德大模型MindLLM，小模型潜力巨大

大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能，但是由于训练和推理大参数量模型需要大量的计算资源，导致高昂的成本，将大语言模型应用在专业领域中仍存在诸多现实问题。因此，北理团队先从轻量级别模型入手，最大程度发挥数据和模型的优势，立足更...

AIGC 2023-10-28 人工智能

1068阅读

Google 承诺向 OpenAI 竞争对手人工智能初创公司 Anthropic 投资 20 亿美元

据 CNBC 确认，Google 已同意向 Anthropic 投资高达 20 亿美元，该公司是由前 OpenAI 执行官创立的人工智能初创企业。该投资承诺包括预付 5 亿美元的现金注入，以及额外的 15 亿美元将随着时间的推移投入。Anthropic...

AIGC 2023-10-28 人工智能

1015阅读

智谱AI推出第三代基座大模型上线新一代「智谱清言」

智谱AI宣布于2023中国计算机大会（CNCC）上，推出了全自研的第三代基座大模型 ChatGLM3及相关系列产品。据介绍，今年以来，这是智谱AI第三次对ChatGLM基座模型进行了深度优化，拥有了更强大的功能。智谱AI采用了独创的多阶段增强预训练方法，...

人工智能 2023-10-27 人工智能

1273阅读

实测腾讯AI文生图！王者荣耀画风一键直出，小程序就能玩

鹅厂大模型，又有新玩法! 发布不到两个月，腾讯混元大模型就速通了一个新版本，除了语言模型升级以外，还悄悄上线了AIGC最火热?的功能—— 文生图。和语言模型一样，文生图同样可以通过微信小程序直接体验。不过与Midjourney独立出图不同，混元的文生...

AIGC 2023-10-27 人工智能

1483阅读

Google AI负责人称AI对人类生存构成威胁

谷歌AI负责人Demis Hassabis表示，人工智能的发展对人类构成了一种存在威胁，类似于气候变化。他在接受《卫报》采访时指出，他担心人类可能会开发出一个失控的超级智能系统，以及其他恶意可能性。他认为我们必须像对待气候变化一样认真对待人工智能的风险。...

AIGC 2023-10-27 人工智能

824阅读

Bing AI图片生成器拒绝生成女性的逼真图像，称其“不安全”

微软的Bing AI Image Creator最近引起了关注，因为它似乎拒绝生成逼真的女性图像，声称这些图像不符合其内容政策。这一现象引发了许多讨论，特别是关于AI系统如何处理性别相关问题。一位名为 u/Arceist_Justin 的用户要求Bing...

人工智能 2023-10-27 人工智能

1001阅读

用检索增强生成技术解决人工智能幻觉问题

作者| Rahul Pradhan 来源| https://www.infoworld.com/article/3708254/addressing-ai-hallucinations-with-retrieval-augmented-generatio...

AIGC 2023-10-27 人工智能

1043阅读

吃“有毒”数据，大模型反而更听话了！来自港科大&华为诺亚方舟实验室

现在，大模型也学会“吃一堑，长一智”了。来自香港科技大学和华为诺亚方舟实验室的最新研究发现：相比于一味规避“有毒”数据，以毒攻毒，干脆给大模型喂点错误文本，再让模型剖析、反思出错的原因，反而能够让模型真正理解“错在哪儿了”，进而避免胡说八道。具体...

人工智能 2023-10-27 人工智能

795阅读