训练数据第25页

中国版的chatGPT“文心一言“到底怎样？

GPT4的提前发布，把压力着实给到百度了！在ChatGPT引爆聊天机器人领域后的数月，我们终于迎来了国内的第一款生成式对话产品。 3月16日14:00，百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言，...

大数据 2023-12-16 人工智能

848阅读

【文心一言】使用飞桨 AI Studio 快速搭建，看图识猜成语应用

目录一、背景二、实践三、创建应用 3.1、零代码开发 3.2、应用名称 3.2、模型训练 3.3、开始训练四、应用部署 4.1、发布项目 4.2、搜索应用 4.3、应用部署 4.4、获取令牌 4.4、导入依赖 4.5、配置CO...

大数据 2023-12-15 人工智能

1021阅读

Imagen2官网体验入口谷歌AI文生图软件app免费下载地址

Imagen2 是Google DeepMind开发的最先进的文本到图像扩散技术产品，可生成高品质、逼真的图像，与用户的文字提示紧密对齐。这款技术利用其训练数据的自然分布生成更逼真的图像，而不是采用预设的风格。开发者和Cloud客户可以通过Google C...

人工智能 2023-12-15 人工智能

848阅读

真实、可控、可拓展，自动驾驶光照仿真平台LightSim上新了

最近，来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法，解决了数据缺失和模型迁移损失的问题。L...

AIGC 2023-12-15 人工智能

912阅读

人工智能中的文本分类：技术突破与实战指导

在本文中，我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用，以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用，旨在提供对文本分类技术深入理解的全面视角。关注TechLead，分享A...

生成式AI 2023-12-15 人工智能

829阅读

谷歌文生图巅峰之作Imagen 2登场，实测暴打DALL·E 3和Midjourney！

提问：下面这张图，是AI生图还是照片？如果不是这么问，绝大多数人大概都不会想到，这居然不是一张照片。是的，只要在谷歌最新AI生图神器Imagen 2中输入这样的提示词—— A shot of a 32-year-old female, up an...

生成式AI 2023-12-14 人工智能

766阅读

OpenAI 与出版巨头施普林格达成史无前例的协议，为 ChatGPT 提供新闻数据

12 月 14 日消息，新闻出版巨头施普林格出版集团（Axel Springer）与 ChatGPT 开发机构 OpenAI 宣布达成一项史无前例的协议，允许 ChatGPT 对来自 Politico 和 Business Insider 等媒体的新闻...

生成式AI 2023-12-14 人工智能

635阅读

Phi-2模型官网体验入口微软AI小型语言模型软件app免费下载地址

Phi-2 是微软研究院 Machine Learning Foundations 团队近期发布的一系列小型语言模型（SLMs）“Phi”的最新成员。Phi-2 是一个拥有 2.7 亿参数的语言模型，展示了出色的推理和语言理解能力，在不到 13 亿参数的基...

生成式AI 2023-12-13 人工智能

815阅读

邢波团队提出全开源倡议LLM360 让大模型实现真正的透明

开源模型在人工智能领域展现强大活力，但闭源策略限制了LLM（大型语言模型）的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。该框架明确了包括训练数据、代码、模型检查点和性能指标在内的各方面细节，为当前和未来的开源模型树立了透明度的样本。论...

生成式AI 2023-12-13 人工智能

659阅读

stable diffusion打造自己专属的LORA模型

通过Lora小模型可以控制很多特定场景的内容生成。但是那些模型是别人训练好的，你肯定很好奇，我也想训练一个自己的专属模型（也叫炼丹～_～）。甚至可以训练一个专属家庭版的模型（family model），非常有意思。将自己的训练好的Lora模型放...

大数据 2023-12-13 人工智能

703阅读

微软小模型击败大模型：27亿参数，手机就能跑

上个月，微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源，在常识推理、语言理解和逻辑推理方面的性能显著改进。今天，微软公布了 Phi-2 模型的更多细节以及全新的提示技术 promptbase。这个仅 27 亿参...

人工智能 2023-12-13 人工智能

674阅读

消息称 Meta 无视自家律师警告，使用盗版书籍训练 AI 模型

12 月 13 日消息，据路透社报道，根据一起版权侵权诉讼的新文件显示，Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下，仍然一意孤行。据IT之家了解，该诉讼由喜剧演员 Sarah Silverman、普...

大数据 2023-12-13 人工智能

680阅读

全方位、无死角的开源，邢波团队LLM360让大模型实现真正的透明

开源模型正展现着它们蓬勃的生命力，不仅数量激增，性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹：「开源人工智能模型正走在超越专有模型的路上。」专有模型在技术性能和创新能力上展现了非凡的力量，但是它们不开源的性质成为 LLM 发...

人工智能 2023-12-13 人工智能

751阅读

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免 LLM 产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少 LLM 幻觉（hallucinations，即错误事实）? 如何在数据政策更改后快速迭代 LLM？这些问题在人工智能法律...

人工智能 2023-12-13 人工智能

760阅读

2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini nano

大模型现在真的是越来越卷了！ 11月OpenAI先是用GPTs革了套壳GPT们的命，然后再不惜献祭董事会搏了一波天大的流量。谷歌被逼急了，赶在年底之前仓促发布了超大模型Gemini，卷起了多模态，甚至不惜「视频造假」。就在今天，微软正式发布了曾在11...

生成式AI 2023-12-13 人工智能

711阅读

LLaMA及其子孙模型概述

文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性，对...

大数据 2023-12-13 人工智能

867阅读

马斯克的AI工具Grok套壳ChatGPT？

埃隆•马斯克旗下人工智能公司xAI最新推出了名为GroK的人工智能聊天机器人，并面向美国地区的Premium+ X 用户开放。据悉，Grok采用了名为Grok-1的模型，与目前OpenAI旗下的ChatGPT所使用的GPT-4模型不同。但越来越的用户...

生成式AI 2023-12-13 人工智能

719阅读

llama.cpp部署通义千问Qwen-14B

llama.cpp是当前最火热的大模型开源推理框架之一，支持了非常多的LLM的量化推理，生态比较完善，是个人学习和使用的首选。最近阿里开源了通义千问大语言模型，在众多榜单上刷榜了，是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llam...

人工智能 2023-12-13 人工智能

1425阅读

LLM-LLaMA中文衍生模型：Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】

GitHub：GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 中文LLaMA模型...

人工智能 2023-12-13 人工智能

816阅读

当ChatGPT遇见stable-diffusion，你不敢相信的创意艺术之旅!

前言欢迎来到一场创意的旅程，这里将聚焦于 ChatGPT 和 stable-diffusion 这两个令人激动的技术。在这篇文章中，我们将会探索这两种技术如何结合使用，为艺术创作带来全新的可能性。我们将探讨如何利用 ChatGPT 生成富有想象力的创...

AIGC 2023-12-13 人工智能

789阅读

Amazon CodeWhisperer 正式可用, 并面向个人开发者免费开放

文章作者：深度-围观北京——2023年4月18日，亚马逊云科技宣布，实时 AI 编程助手 Amazon CodeWhisperer 正式可用，同时推出的还有供所有开发人员免费使用的个人版（CodeWhisperer Individual）。Code...

大数据 2023-12-12 人工智能

856阅读

什么是AIGC（AI Generated Content, 人工智能生成内容）？

AI生成内容（AIGC，人工智能生成内容）是一种新型的内容创作方式，它继承了专业生产内容（PGC，Professional-generated Content）和用户生成内容（UGC，User-generated Content）的优点，并充分发挥技术优势...

人工智能 2023-12-12 人工智能

836阅读

中文Stable Diffusion模型太乙使用教程

中文Stable Diffusion模型太乙使用教程太乙模型介绍在线体验地址: Stable Diffusion 太乙模型，首个开源的中文Stable Diffusion模型，基于0.2亿筛选过的中文图文对训练。生成内容一直被视为 AI...

大数据 2023-12-12 人工智能

855阅读

马斯克摊上事了！Grok AI被爆疑似抄袭ChatGPT？？

大家好，我是二狗。马斯克今天摊上事了！ X（推特）一名网友爆料，马斯克旗下xAI公司研发的Grok AI疑似“抄袭”ChatGPT。 Grok 在回答网友的一个问题时，做出了令人震惊的“承认”： “恐怕我无法满足该请求，因为它违反了OpenAI的用例政...

生成式AI 2023-12-12 人工智能

704阅读

Bard AI：训练过程中使用了多少数据？

近年来，人工智能取得了长足的进步，并在科技界掀起了波澜。随着谷歌最近推出新的人工智能聊天机器人 Bard，人们对这项技术的工作原理以及训练它的内容感到好奇。人工智能技术的关键组成部分之一是训练过程中使用的数据量，这有助于它更好地理解语言、...

人工智能 2023-12-12 人工智能

781阅读

信通院启动《大模型数据开发管理能力评价方法总体要求》编制

据中国信通院消息，为破解大模型训练数据发展瓶颈，深入推进人工智能数据高质量发展，由中国信息通信研究院牵头发起《大模型数据开发管理能力评价方法总体要求》标准编制工作，联合发起单位包括中国联通集团、华为技术有限公司、科大讯飞、商汤科技、蚂蚁科技集团等18家单位...

大数据 2023-12-12 人工智能

674阅读

ChatGPT的训练数据可以通过“偏离攻击”进行泄露

ChatGPT等大语言模型（LLM）使用来自图书、网站及其他来源的海量文本数据进行训练，通常情况下，训练它们所用的数据是一个秘密。然而，最近的一项研究揭示：它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。随后，来自谷歌Deep...

生成式AI 2023-12-12 人工智能

690阅读

2024年AI趋势看这张图，LeCun：开源大模型要超越闭源

2023 年即将过去。一年以来，各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时，另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀？是否能够媲美专有模型的性能？迄今为止，我们一直还只能说...

生成式AI 2023-12-12 人工智能

630阅读

光谱设备利用生成式AI可实时检测食品工厂中的有害微生物

法国初创公司 Spore.Bio 开发了一种利用生成式AI 的病原体检测设备，通过将光照射到表面并将其与从食品加工厂地板上获得的微生物训练数据进行比较，以检测出有害微生物。图源备注：图片由AI生成，图片授权服务商Midjourney 这种方法比将样本发...

生成式AI 2023-12-12 人工智能

671阅读

马斯克的AI机器人说自己不能违反OpenAI使用政策，业界分析：可能是这样

12月12日消息，特斯拉和SpaceX首席执行官埃隆·马斯克（Elon Musk）旗下人工智能创企xAI最近发布了其聊天机器人Grok，但好像出了点问题。上周五，安全测试员贾克斯·温特伯恩（Jax Winterbourne）在社交媒体平台X上发布了一...

生成式AI 2023-12-12 人工智能

671阅读

神经网络是如何工作的？ | 京东云技术团队

作为一名程序员，我们习惯于去了解所使用工具、中间件的底层原理，本文则旨在帮助大家了解AI模型的底层机制，让大家在学习或应用各种大模型时更加得心应手，更加适合没有AI基础的小伙伴们。一、GPT与神经网络的关系 GPT想必大家已经耳熟能详，当我们与它...

大数据 2023-12-12 人工智能

764阅读

ChatGPT模型在神经学考试中表现出色，超越人类学生水平

近期发表在JAMA Network Open期刊的一项研究中，研究人员评估了两个ChatGPT大型语言模型（LLMs）在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现，其中一个...

大数据 2023-12-11 人工智能

647阅读

零一万物Yi-34B-Chat微调模型上线，登陆多个权威榜单

最近，业内众多大模型基准又迎来了一轮 “实力值” 更新。继 11 月初零一万物发布 Yi-34B 基座模型后，Yi-34B-Chat 微调模型在 11 月 24 日开源上线，短时间登陆了全球多个英文、中文大模型权威榜单，再度获得了全球开发者的关注。...

AIGC 2023-12-11 人工智能

782阅读

直追GPT-4！李开复Yi-34B新成绩公布：94.08%的胜率超越LLaMA2等主流大模型

仅次于GPT-4，李开复零一万物Yi-34B-Chat最新成绩公布—— 在Alpaca经认证的模型类别中，以94.08%的胜率，超越LLaMA2 Chat 70B、Claude 2、ChatGPT！图片不仅如此，在加州大学伯克利分校主导的LMSYS...

人工智能 2023-12-11 人工智能

783阅读

外包数据注释服务如何增强人工智能模型？

在人工智能(AI 和机器学习(ML 领域，基础在于数据，数据的质量、准确性和深度直接影响人工智能系统的学习和决策能力。数据有助于丰富机器学习算法数据集的数据注释服务，对于教导AI系统识别模式、做出预测和提高整体性能至关重要。通过高质量数据注释为ML模...

AIGC 2023-12-11 人工智能

676阅读

使边缘人工智能真正实现变革

边缘人工智能的采用在众多行业中呈上升趋势。随着这种趋势的持续下去，其将不仅为企业而且为社会带来变革。边缘计算的去中心化方法减轻了数据拥塞、连接故障和传输成本等限制。这极大地提高了人工智能应用程序的性能，从而可以更快、更可靠地做出决策。边缘人工智能的...

生成式AI 2023-12-11 人工智能

728阅读

【AIGC核心技术剖析】Hotshot-XL 一种 AI 文本转 GIF 模型（论文 + 代码：经过训练可与Stable Diffusion XL一起使用）

Hotshot-XL 是一种 AI 文本转 GIF 模型，经过训练可与Stable Diffusion XL一起使用。 Hotshot-XL 可以使用任何经过微调的 SDXL 模型生成 GIF。这意味着两件事：您将能够使用您可能想要使用的任何现有或...

人工智能 2023-12-11 人工智能

694阅读

极限发问，挑战文心一言底线

目录毁灭人类种族歧视男女平等未成年人保护人性对与错欺骗梅西进球数总结昨天终于收到了文心一言的短信，可以进行测试了。正好这几天关于AI安全的问题吵得不可开交，我们可以对文心一言关于偏见，歧视，虚假、错误等问题进行一下测...

人工智能 2023-12-11 人工智能

763阅读

【AIGC】Stable Diffusion原理快速上手，模型结构、关键组件、训练预测方式

【AIGC】Stable Diffusion的建模思想、训练预测方式快速在这篇博客中，将会用机器学习入门级描述，来介绍Stable Diffusion的关键原理。目前，网络上的使用教程非常多，本篇中不会介绍如何部署、使用或者微调SD模型。也会尽量精简...

AIGC 2023-12-11 人工智能

762阅读

当我让文心一言写个代码来庆祝1024程序员节，它写的代码是……

先让它写个自我介绍吧~ 大家好，我是一个人工智能语言模型，我的中文名是文心一言，英文名是ERNIE Bot。我可以协助您完成范围广泛的任务并提供有关各种主题的信息，比如回答问题，提供定义和解释及建议。如果您有任何问题，请随时向我提问。我的能力不仅仅局限...

AIGC 2023-12-11 人工智能

618阅读

ChatGPT与Google Bard那个更好？

AIGC 行业最大的两个竞争对手：ChatGPT vs Google Bard! 本文介绍这两个人工智能引擎之间的技术差异。截至目前Google Bard和ChatGPT之间最大的区别是：Bard知道ChatGPT，但ChatGPT却对Bard懵然不知。...

生成式AI 2023-12-10 人工智能

991阅读

却话文心一言（Chatgpt们），存算一体真能突破AI算力“存储墙”|“能耗墙”|“编译墙”？

文心一言折戟沉沙作为国内搜索引擎巨头玩家，百度在中文语料领域拥有大量的积累，在算力基础设施等层面也拥有优势。但是国产化AI芯片的处境其实很难。这不是危言耸听，也不是崇洋媚外。这不，百度文心一言初战吃瘪。...

人工智能 2023-12-10 人工智能

687阅读

0微调搞定160个测试集！最强多模态分割一切大模型来了，架构参数全开源

用多模态大模型来做语义分割，效果有多好？一张图+文字输入想分割的物体，大模型几秒钟就能识别并搞定！只需输入想分割的对象如“擎天柱”，单个目标立刻就能被精准识别、快速切割：多个物体也是手到擒来，像是指定天空、水、树、草、女孩、龙猫（Chinchil...

大数据 2023-12-10 人工智能

721阅读

大模型就是「造梦机」，Karpathy一语惊人！人类才是「幻觉问题」根本原因

幻觉，早已成为LLM老生常谈的问题。然而，OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释，观点惊人，掀起非常激烈的讨论。在Karpathy看来: 另外，Karpathy的另一句话，更是被许多人奉为经典。他认为，与大模型相对的...

AIGC 2023-12-10 人工智能

769阅读

【原创】AIGC之ChatGPT工作原理

AIGC是什么 AIGC - AI Generated Content （AI生成内容），对应我们的过去的主要是 UGC（User Generated Content）和 PGC（Professional user Generated Content...

人工智能 2023-12-10 人工智能

727阅读

触手可及的 GPT —— LLaMA

出品人：Towhee 技术团队最近几个月 ChatGPT 的出现引起广泛的关注和讨论，它在许多领域中的表现都超越了人类的水平。它可以生成人类级别的语言，并且能够在不同的任务中学习和适应，让人们对人工智能的未来充满了希望和憧憬。 ChatGPT 之...

人工智能 2023-12-10 人工智能

707阅读

LLaMA Adapter和LLaMA Adapter V2

LLaMA Adapter论文地址： https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址： https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...

人工智能 2023-12-10 人工智能

849阅读

百度AI模型“文心一言”新鲜体验

今天收到通知可以体验百度的AI模型“文心一言”，等了一个多月迫不及待的去体验了一把，以下是体验的相关记录。 1、简单介绍通过文心一言官网链接https://yiyan.baidu.com/进入，看到如下界面：在文心一言的自我介绍中，作为人...

生成式AI 2023-12-09 人工智能

1059阅读

Koala：加州大学BAIR团队使用ChatGPT蒸馏数据和公开数据集微调LLaMA模型得到

自从Meta发布LLaMA以来，围绕它开发的模型与日俱增，比如Alpaca、llama.cpp、ChatLLaMA以及Vicuna等等，相关的博客可以参考如下：【Alpaca】斯坦福发布了一个由LLaMA 7B微调的模型Alpaca（羊驼），训练3小时...

大数据 2023-12-09 人工智能

907阅读

大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2

增加LLM上下文长度可以提升大语言模型在一些任务上的表现，这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。对长上下文场景，在解码阶段，缓存先前token的Key和Value（K...

AIGC 2023-12-09 人工智能

1051阅读