训练数据第14页

关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答

文章目录关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答先总结一下 Q：LLM模型预训练前与提示词关系，LLM模型预训练后与提示词关系 Q：预训练用的数据集与提示词有什么异同 Q：为什么我看到的数据集结构和提示词结...

人工智能 2024-03-11 人工智能

954阅读

李彦宏：百度文心一言4.0中文已超过ChatGPT 4.0

快科技3月10日消息，日前，百度创始人李彦宏在央视2024《对话开年说》节目中谈到了百度文心一言。李彦宏表示，文心一言4.0在中文上已经超过ChatGPT4.0。比如写藏头诗，现在很多大模型都能写，但如果要求它写一个《沁园春》词牌的词，ChatGPT4...

AIGC 2024-03-10 人工智能

725阅读

怎么劝ChatGPT干活效果最好？我们尝试了100种方法，有图有真相

在 ChatGPT API 中，系统提示是一项很有亮点的功能，它允许开发人员控制 LLM 输出的「角色」，包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令要有效得多，这让开发人员拥有了更大的发挥空间，而不是像现在使用 ChatGPT 网页应用程序...

人工智能 2024-03-10 人工智能

813阅读

下一代软件开发：AIGC智能编程与持续集成的完美结合

AIGC智能编程与持续集成/持续部署工具的无缝集成近年来，随着软件开发的快速发展和自动化工具的广泛应用，持续集成（Continuous Integration）和持续部署（Continuous Deployment）已经成为现代软件开发中不可或缺的一...

人工智能 2024-03-10 人工智能

848阅读

破茧而出：从困惑到爆发的AI写作之旅

大家好，小发猫降重今天来聊聊破茧而出：从困惑到爆发的AI写作之旅，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：标题：破茧而出：从困惑到爆发的AI写作之旅在数字时代的浪潮中，AI写作逐渐成...

人工智能 2024-03-08 人工智能

761阅读

GPT-4王冠没掉！Claude 3竞技场人类投票成绩出炉：仅居第三

Claude 3的竞技场排名终于来了：短短3天内，20000张投票，将榜单的流量推向空前。最终，Claude 3最强的“大杯”模型Opus得分1233，成为第一个能和GPT-4-Turbo一较高下的选手。 “中杯”Sonnet也还不错，和GPT-4的...

生成式AI 2024-03-08 人工智能

759阅读

文心一言 VS ChatGPT-4

文心一言和ChatGPT-4都是非常强大的自然语言处理模型，它们都能够在对话系统和其他NLP应用中发挥巨大的作用。然而，它们之间还是存在一些区别：训练数据：ChatGPT-4是由OpenAI训练的，它使用了大量的网络文本来进行训练，因此它具有非常广...

大数据 2024-03-08 人工智能

837阅读

看了30000小时视频，谷歌模型发现不同于Sora的新方法，可与虚拟世界沉浸交互，向世界模型再进一步

撰稿丨今日晴出品 | 51CTO技术栈（微信号：blog51cto）当下，生成式AI的高速发展让人们已经逐渐习惯了各种可以生成文本、图像、音频乃至视频的AI工具。而最近谷歌DeepMind推出的Genie模型则实现了一种完全不同的功能，它能将图像转...

人工智能 2024-03-07 人工智能

817阅读

男子AI换脸复活已故父亲：宽慰奶奶

3月6日消息，据国内多家媒体报道，一名男子的父亲患病去世半年，全家人都瞒着奶奶，但奶奶太想他了。于是，该男子特意刮去胡子，打扮成爸爸的样子，用AI换脸复活”父亲，以此宽慰奶奶。公开报道显示，人脸交换技术在电影制作领域已经不是新鲜词，但之前电影视频中的人...

生成式AI 2024-03-06 人工智能

735阅读

破解AIGC困局：七步降低总体疑似度，提升内容质量

大家好，小发猫降重今天来聊聊破解AIGC困局：七步降低总体疑似度，提升内容质量，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：破解AIGC困局：七步降低总体疑似度，提升内容质量内容：在...

人工智能 2024-03-06 人工智能

1892阅读

AI写作的疑似度：困惑与爆发的探索之旅

大家好，小发猫降重今天来聊聊AI写作的疑似度：困惑与爆发的探索之旅，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI写作的疑似度：困惑与爆发的探索之旅在人工智能的浪潮下，AI写作已逐渐成...

生成式AI 2024-03-06 人工智能

723阅读

Stability AI发布3D生成模型TripoSR 不用1秒就能生成高质量3D模型

Stability AI 和 Tripo AI 昨晚联合发布了一款名为 TripoSR 的3D 生成模型。这款模型能够在不到1秒的时间内生成高质量的3D 模型，这一创新技术的推出无疑将为3D 建模领域带来革命性的变革。 TripoSR 的推理过程只需要极低...

AIGC 2024-03-05 人工智能

737阅读

央视财经推出两会AI主播，蚂蚁灵境数字人平台技术支持

还记得杭州亚运会开幕式点燃主火炬环节，让世界惊艳的“数字火炬手”吗?如今，用“同款”技术打造的AI主播在央视财经亮相了! （央视财经客户端上线两会AI主播）今年两会，央视财经新媒体以总台央视主持人郭若天、孟湛东为原型“复刻”了AI主播——小天、小东。两...

生成式AI 2024-03-05 人工智能

985阅读

GPT-4时代已过？全球网友实测Claude 3，只有震撼

大模型的纯文本方向，已经卷到头了？昨晚，OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude 3。该系列包含三个模型，按能力由弱到强排列分别是 Claude 3 Haiku、Claude 3 Sonnet...

AIGC 2024-03-05 人工智能

864阅读

Cohere 与埃森哲合作加速企业 AI 应用

Cohere 很高兴宣布与埃森哲合作，旨在将我们最先进的 Command 和 Embed 模型以及业界领先的检索增强生成（RAG）功能带给企业，助力企业跨部门推广生成式人工智能的应用。这两家公司将联手为企业提供由 Cohere 的旗舰专有生成 LLM 模...

人工智能 2024-03-05 人工智能

809阅读

0.5秒，无需GPU，Stability AI与华人团队VAST开源单图生成3D模型TripoSR

最近，文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮，模型的多模态能力引起广泛关注。现在，AI 模型在 3D 内容生成方面又有了新突破。专长于视觉内容生成的 Stability AI 继图片生成（Stable Difussion 3 上线...

人工智能 2024-03-05 人工智能

812阅读

谷歌发布最新「读屏」AI！PaLM 2-S自动生成数据，多项理解任务刷新SOTA

【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型，能够完成各种屏幕QA问答、总结摘要等任务。每个人想要的大模型，是真·智能的那种...... 这不，谷歌团队就做出来了一个强大的「读屏」AI。研究人员...

生成式AI 2024-03-05 人工智能

819阅读

AI辅写疑似度多少正常：探索智能写作的边界

大家好，小发猫降ai今天来聊聊AI辅写疑似度多少正常：探索智能写作的边界，希望能给大家提供一点参考。降ai辅写以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有： AI辅写疑似度多少正常：探索智能写作的边界...

AIGC 2024-03-05 人工智能

1182阅读

xiunobbs采集技巧与最佳实践

由于“xiunobbs采集”似乎是一个特定的主题或术语，但在我的训练数据中没有明确的上下文或广泛认可的定义，因此我将根据一般的理解和可能的应用场景来构建这篇文章。请注意，这篇文章将是假设性的，并且会努力达到1500字的要求。---标题：探索xiunobbs...

大数据 2024-03-05 大数据

1059阅读

全面超越GPT-4，Claude 3终于来了，有大学生智商，支持百万token

大模型的纯文本方向，已经卷到头了? 刚刚，OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude3。该系列包含三个模型，按能力由弱到强排列分别是 Claude3Haiku、Claude3Sonnet 和 Cla...

大数据 2024-03-05 人工智能

1045阅读

DeepMind携Mamba华人作者推Transformer革命之作！性能暴涨媲美Llama 2，推理能效大幅碾压

Transformer又又又被挑战了！这次的挑战者来自大名鼎鼎的谷歌DeepMind，并且一口气推出了两种新架构，——Hawk和Griffin。论文地址：https://arxiv.org/abs/2402.19427 这种将门控线性RNN与局部注...

大数据 2024-03-04 人工智能

789阅读

Beeble AI与纽约大学合作发布创新的人像重照明技术SwitchLight

近日，Beeble AI与纽约大学联手发布了一项新的研究成果，一种创新的人像重照明技术。这项技术能够在非常低的成本下，将人物与虚拟环境的光照完美融合，效果令人印象深刻。论文地址：https://arxiv.org/pdf/2402.18848.pdf...

大数据 2024-03-04 人工智能

800阅读

从AI推理性能优化角度看LLaMA的模型结构和源码

本篇文章讲讲LLaMA的结构，已经有很多文章已经对LLaMA在一些结构上任务表现上做了一些解析，本文主要从优化的角度、实现kernel的角度解析一下LLaMA，读者事先对transformer的结构有基本认识最好。本文首发于我的公众号“AI不止算法”，文章...

AIGC 2024-03-04 人工智能

1018阅读

AI帮写会重复吗：解析AI写作工具的独特性与重复性

大家好，小发猫降ai今天来聊聊AI帮写会重复吗：解析AI写作工具的独特性与重复性，希望能给大家提供一点参考。降ai辅写以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有： AI帮写会重复吗：解析AI写作工具的...

大数据 2024-03-03 人工智能

800阅读

前沿资讯！文心一言和ChatGPT最全对比！

文心一言和ChatGPT都是基于深度学习技术的自然语言处理模型，有各自的优势和使用场景，无法简单地比较 ChatGPT 和文心一言哪一个功能更强大，它们各自具有优势和局限性，需要根据具体需求进行选择，以下一些具体对比：为方便观看，...

人工智能 2024-03-03 人工智能

892阅读

揭秘AI写作疑似度检测：从困惑到明晰的七大秘籍

大家好，今天来聊聊揭秘AI写作疑似度检测：从困惑到明晰的七大秘籍，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具：标题：揭秘AI写作疑似度检测：从困惑到明晰的七大秘籍随着AI技术的普及，AI...

生成式AI 2024-03-02 人工智能

1162阅读

十分钟读完 Meta提出Llama 2模型的经典论文：Llama 2: Open Foundation and Fine-Tuned Chat Models

超越GPT-3：Meta AI发布新一代开源人工智能对话大模型Llama 2 引言：介绍 Llama 2 的发布背景和其在对话用例中的优化。随着人工智能技术的飞速发展，大型语言模型（LLMs）已经成为了人类智能助手的代表，它们在需要专业知识的复杂推理...

人工智能 2024-03-02 人工智能

1019阅读

AIGC专题：2023生成式人工智能发展与监管白皮书-中国AI治理的独立思考

今天分享的是AIGC系列深度研究报告：《AIGC专题：2023生成式人工智能发展与监管白皮书-中国AI治理的独立思考》。（报告出品方：南方财经全媒体集团）报告共计：42页来源：人工智能学派发展：生成式 AI 治理的第一视角 2022年 1...

生成式AI 2024-03-02 人工智能

842阅读

Stable Diffusion 训练

文章目录前言一、主要训练方式二、kohya_ss安装(Linux 1.打开终端并切换到所需的安装目录 2.通过运行以下命令克隆存储库 3.切换到kohya_ss目录 4.通过执行命令来运行安装脚本 5.安装完成后，在kohya_ss目...

大数据 2024-03-01 人工智能

1316阅读

对抗「概念飘逸」难题！谷歌发布全新时间感知框架：图像识别准确率提升15%

在机器学习领域，概念漂移（concept drift）问题长期困扰着研究者，即数据分布随时间发生变化，使得模型难以持续有效。一个显著的例子是CLEAR非稳态学习基准的图像展示，它揭示了物体视觉特征在十年间发生的显著变化。这种现象被称为「缓慢的概念漂移...

大数据 2024-03-01 人工智能

813阅读

OpenAI或用3D引擎/虚幻引擎训练视频模型Sora

OpenAI最近发布了多段由Sora生成的视频，展示了令人惊叹的3D效果。这些视频内容丰富，包括潜水探索沉船、描述日本江户时代宁静场景的立体模型等。除此之外，Sora还展示了一些新功能，比如无缝衔接。这意味着在两个输入视频之间可以逐渐进行插值，呈现出更加...

大数据 2024-03-01 人工智能

745阅读

【AIGC】AutoKeras 进行 RNN 循环神经网络训练

由于最近这些天都在人工审查之前的哪些问答数据，所以迟迟都没有更新 AutoKeras 的训练结果。现在那部分数据都已经整理好了，20w+ 的数据最后能够使用的高质量数据只剩下 2k+。这 2k+ 的数据已经经过数据校验并且对部分问题的提问方式和答案内容进行...

生成式AI 2024-03-01 人工智能

796阅读

如何使用小型自动生成的数据集训练编码LLM

译者 | 李睿审校 | 重楼虽然像GPT-4这样的大型语言模型(LLM 在编写软件代码方面非常精通，但是这些模型的成本和不透明性激发了人们对更加经济、规模更小的编码LLM的兴趣。这些替代方案可以针对特定任务进行微调，并且成本很低。开发这些LLM的...

生成式AI 2024-03-01 人工智能

801阅读

使用Rust的Linfa和Polars库进行机器学习：线性回归

在这篇文章中，我们将使用Rust的Linfa库和Polars库来实现机器学习中的线性回归算法。 Linfa crate旨在提供一个全面的工具包来使用Rust构建机器学习应用程序。 Polars是Rust的一个DataFrame库，它基于Apache Ar...

大数据 2024-03-01 人工智能

831阅读

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法：它仅用8k大小的token文档进行训练，就能将Llama-2窗口扩展至128k。最重要的是，在这个过程中，只需要原来1/6的内存，模型就获得了10倍吞吐量。除此之外，它还能大大降低训练成本：...

人工智能 2024-02-29 人工智能

790阅读

英伟达、Hugging Face和ServiceNow发布用于代码生成的新StarCoder2 LLM

这些模型目前有三种不同的大小，已经在600多种编程语言(包括低资源语言上进行了培训，以帮助企业在其开发工作流中加速各种与代码相关的任务，它们是在开放的BigCode项目下开发的，该项目是ServiceNow和Huging Face联合发起的，以确保...

大数据 2024-02-29 人工智能

881阅读

英伟达发布Nemotron-4:150亿参数通用大模型，目标单张A100/H100可跑

英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数，经过在8T token上的训练，在英语、多语言和编码任务中表现出色。具体而言，Nemotron-4在7个评估基准上的15B模型表现优异，超越同等参数规模的模型，甚至击...

人工智能 2024-02-29 人工智能

811阅读

AI写作：探索人类文字的边界

大家好，今天来聊聊AI写作：探索人类文字的边界，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI写作：探索人类文字的边界在信息爆炸的时代，AI写作已经从科幻概念逐渐成为我们生活的一部分。...

AIGC 2024-02-29 人工智能

770阅读

英伟达最强通用大模型Nemotron-4登场！15B击败62B，目标单张A100/H100可跑

最近，英伟达团队推出了全新的模型Nemotron-4，150亿参数，在8T token上完成了训练。值得一提的是，Nemotron-4在英语、多语言和编码任务方面令人印象深刻。论文地址：https://arxiv.org/abs/2402.1681...

AIGC 2024-02-29 人工智能

801阅读

厦门大学、Intel、大疆联合出品，从网络视频中学习零样本图像匹配大模型

图像匹配是计算机视觉的一项基础任务，其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位和神经渲染 (neural rendering 等的基础和前置步骤，其精确度和效率对于后续处理十分重要。传统算法（SIFT）在面临...

生成式AI 2024-02-29 人工智能

875阅读

谷歌豪掷6000万美元买「美版贴吧」数据，只为训AI模型！Altman竟是第三大股东

破案了！上周，Reddit被发现签署了一项价值6000万美元的协议，允许一家不知名公司访问其用户内容，来训练AI模型。今天大家发现，Reddit数据的神秘买家，居然就是谷歌？图片目前，双方已同时官宣达成合作协议：Reddit的数据将帮助谷歌训练A...

AIGC 2024-02-28 人工智能

736阅读

报道称，Tumblr 所有者正在与 OpenAI 和 Midjourney 就训练数据达成协议

Tumblr 和 WordPress.com 的所有者 Automattic 正与 AI 公司 Midjourney 和 OpenAI 就提供用户帖子的训练数据进行谈判。据报道，Automattic 计划推出一个新设置，允许用户选择退出与第三方（包括 A...

生成式AI 2024-02-28 人工智能

787阅读

探索生成式人工智能和云的相互优势

近年来对生成式人工智能和云融合的兴趣是有原因的。生成人工智能(AI 和云计算都彻底改变了IT格局，分别重塑了行业并为新技术工具提供了前所未有的功能。让我们探讨一下生成式人工智能对云的深远影响，以及云如何赋能和增强生成式人工智能的能力。云为业务用例释放...

生成式AI 2024-02-28 人工智能

677阅读

Sora阴影之下，焦虑的中国AI

“跟不上的可能就要被淘汰了。”看到Sora演示视频后，从业10多年的动画制作师黄斌得出了这样的判断。随着影视业失业潮呼声渐起，Sora的诞生也给中国AI行业带来了巨大的焦虑。 360集团创始人周鸿祎认为，Sora模型展现出了超越当前中国同类产品的性能...

AIGC 2024-02-28 人工智能

733阅读

OpenAI：纽约时报雇黑客攻击我

堂堂AI巨头，怎么就被一家报纸雇黑客攻击了？《纽约时报》诉OpenAI侵犯版权索赔数十亿美元案最新进展：在最新提交的法庭文件中，OpenAI声称《纽约时报》花钱找黑客攻击ChatGPT，人为制造侵权结果。使用欺骗性手段进行数万次尝试，才得到高度异常...

生成式AI 2024-02-28 人工智能

728阅读

copilot和chatGPT的区别

区别： Copilot和ChatGPT是由OpenAI开发的两个不同的工具，用于不同的任务和场景。以下是它们的主要区别：用途： ChatGPT： ChatGPT是一个生成式语言模型，设计用于与用户进行自然语言交互。它被训练用于回答用户提...

大数据 2024-02-28 人工智能

971阅读

谷歌豪掷6000万美元购买Reddit 数据用来训练AI模型

Reddit 最近宣布与一家未透露的公司签署了一份价值6000万美元的合作协议，允许对 Reddit 用户内容进行访问以训练 AI 模型。而后，揭晓这家神秘公司正是谷歌。图源备注：图片由AI生成，图片授权服务商Midjourney 根据合同，谷歌每年将...

人工智能 2024-02-28 人工智能

751阅读

微软推出用于发现AI模型风险的工具PyRIT

微软公司一个负责利用黑客手段发现网络安全问题的团队开源了一个内部工具PyRIT，该工具可以帮助开发人员发现人工智能模型中的风险。研究人员于本周四发布了该框架的代码。微软表示，PyRIT可以自动生成数以千计的对抗性人工智能提示，来测试神经网络能否有效抵...

大数据 2024-02-27 人工智能

765阅读

“谷歌版Sora”被嘲画质好糊，但在世界模拟器上又前进了一步

谷歌110亿参数Genie，用来打造交互虚拟世界，它来了！划重点：不受视频监督训练；只用给它单张图像，就能提示生成可玩的2D虚拟世界；这个交互式的虚拟世界还自主可控。但令人撇嘴的点，就是Genie最后出的效果，画质太糊了。像这样：或者这样：...

人工智能 2024-02-27 人工智能

826阅读

VAD v2端到端SOTA | 远超DriveMLM等方法（地平线）

从大规模驾驶演示中学习类似人类的驾驶策略是很有前途的，但规划的不确定性和非确定性本质使得这一任务充满挑战。在这项工作中，为了应对不确定性问题，作者提出了VADv2，一个基于概率规划的端到端驾驶模型。VADv2以流方式输入多视角图像序列，将传感器数据转换为...

大数据 2024-02-27 人工智能

1226阅读