训练数据第6页 - AIGC资讯

微软大模型phi-3速览-3.7B比llama-3 8B更好？

背景模型发布者：Microsoft 模型发布时间：2024年4月23日发布内容：介绍了phi-3系列语言模型，包括phi-3-mini、phi-3-small和phi-3-medium。重点关注：整体性能可与 Mixtral 8x7B...

AIGC 2024-06-25 人工智能

602阅读

llama系列模型学习

一、目录 llama1 模型与transformer decoder的区别 llama2 模型架构 llama2 相比llama1 不同之处 llama3 相比llama2 不同之处 llama、llama2、llama3 分词器词表大小以及优缺点...

人工智能 2024-06-25 人工智能

810阅读

大模型测试题爆火，GPT-4和Claude3都跪了，LeCun转发：新Benchmark

一项新的“大模型Benchmark”在推特上爆火，LeCun也点赞转发了! 而且无论是GPT-4还是Claude3，面对它都如同被夺了魂，无法给出正确答案。难倒一众大模型的，是逻辑学当中经典的“动物过河”问题，有网友发现，大模型对此类问题表现得很不擅长...

大数据 2024-06-24 人工智能

507阅读

重磅！Meta 发布 Llama 3，前所未有的强大功能和多模态能力｜TodayAI

Meta今日宣布推出其最新一代尖端开源大型语言模型Llama 3。该模型预计很快将在多个领先的云服务平台上线，包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft A...

生成式AI 2024-06-24 人工智能

596阅读

（5-5-02）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（2）

5.5.4 Llama-2语言模型操作编写下面的代码，功能是加载、配置 Llama-2 语言模型以及其对应的分词器，准备好模型为后续的对话生成任务做好准备。 model_name = "../input/llama-2/pytorch/7b-h...

AIGC 2024-06-24 人工智能

899阅读

详解联邦学习中的异构模型集成与协同训练技术

本文分享自华为云社区《联邦学习中的异构模型集成与协同训练技术详解》，作者：Y-StarryDreamer。引言随着数据隐私和安全问题的日益突出，传统的集中式机器学习方法面临着巨大的挑战。联邦学习（Federated Learning）作为一种新...

AIGC 2024-06-24 人工智能

573阅读

一夜淘汰700人！ChatGPT之母：AI自动化取代人类，创意性工作可能消失

【新智元导读】AI淘汰大部分人类似乎就是一场终局。OpenAI CTO在采访中称，一些创意性的工作会消失。今天，她再次发长文佐证自己的观点。而现在，AI取代大厂的一大批员工真真实实发生了。几天前的采访中，OpenAI CTO直言，AI可能会扼杀一些本来不...

AIGC 2024-06-24 人工智能

502阅读

原来Stable Diffusion是这样工作的

stable diffusion是一种潜在扩散模型，可以从文本生成人工智能图像。为什么叫做潜在扩散模型呢？这是因为与在高维图像空间中操作不同，它首先将图像压缩到潜在空间中，然后再进行操作。在这篇文章中，我们将深入了解它到底是如何工作的,还能够知道文生图...

生成式AI 2024-06-24 人工智能

565阅读

AIGC安全与伦理问题【技术挑战与解决方案】

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

AIGC 2024-06-24 人工智能

794阅读

8 款 Stable Diffusion 最新写实风格 SDXL 大模型推荐！

以上推荐模型可在liblibai或Civitai自行下载即可。排名不分先后。 1、9realisticSDXL：触发词:xxmixgirl；图片尺寸:768*1280；全身：建议开hires，用ad修脸。肖像照：可以不开hires，可以用ad修脸采样次...

大数据 2024-06-23 人工智能

1161阅读

llama 3 震撼来袭 8B 150k 词元 8Ktoken长度 4T token 参与预训练与对齐训练使用GQA

Meta开发了并发布了Meta Llama 3系列大型语言模型(LLMs ，这是一组在8亿和70亿参数规模下预训练和指令调整的生成文本模型。Llama 3的指令调整模型针对对话用例进行了优化，并在常见的行业基准测试中超越了众多开源聊天模型。在开发这些模型时...

人工智能 2024-06-23 人工智能

559阅读

建筑类AIGC图像微调模型（LoRA）训练经验介绍

前言 AIGC大模型正广泛应用于各行业，包括建筑设计。运用这些大模型，设计师可以在设计早期阶段进行方案探索和优化，提高设计效率和满足实际需求。然而，要充分发挥大模型的优势，需要进行微调以适应特定设计任务。这是一项技术挑战，也是创新机会。 AIGC大...

大数据 2024-06-23 人工智能

742阅读

Diffusion Model原理及Stable Diffusion

什么是扩散（diffusion）？扩散一词来自非平衡热力学（non-equilibrium thermodynamics），在非平衡热力学中扩散过程指的是：“在浓度梯度的驱动下，颗粒或分子从高浓度区域移动到低浓度区域。” 什么是扩散模型（di...

人工智能 2024-06-22 人工智能

573阅读

华为云盘古大模型5.0发布：可控时空生成技术重塑自动驾驶开发

快科技6月21日消息，在今日召开的华为开发者大会(HDC 2024 上，华为云发布了盘古大模型5.0，其创新的多模态生成能力，可以为自动驾驶领域提供更高质量的数据支持。华为常务董事、华为云CEO张平安表示，盘古5.0通过创新的可控时空生成，大规模的生成和...

生成式AI 2024-06-22 人工智能

426阅读

重磅！Llama-3，最强开源大模型正式发布！

4月19日，全球科技、社交巨头Meta在官网，正式发布了开源大模型——Llama-3。据悉，Llama-3共有80亿、700亿两种参数，分为基础预训练和指令微调两种模型（还有一个超4000亿参数正在训练中）。与Llama-2相比，Llama-3使用...

AIGC 2024-06-22 人工智能

485阅读

GPTutor: 一个可替代Copilot的开源AI配对编程工具

23年10月CMU的论文“GPTutor: an open-source AI pair programming tool alternative to Copilot”。 GPTutor：一个在Visual Studio代码中使用ChatGPT的编程工...

AIGC 2024-06-21 人工智能

490阅读

LLaMA 羊驼系大语言模型的前世今生

关于 LLaMA LLaMA是由Meta AI发布的大语言系列模型，完整的名字是Large Language Model Meta AI，直译：大语言模型元AI。Llama这个单词本身是指美洲大羊驼，所以社区也将这个系列的模型昵称为羊驼系模型。 Ll...

人工智能 2024-06-21 人工智能

728阅读

Stable Diffusion 是否使用 GPU？

在线工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 3D数字孪生场景编辑器 Stable Diffusion...

人工智能 2024-06-20 人工智能

473阅读

ChatGPT等模型疯狂训练，最快2026年消耗尽公开文本数据

AI发展科研机构Epochai在官网发布了一项，关于大模型消耗训练数据的研究报告。目前，人类公开的高质量文本训练数据集大约有300万亿tokens。但随着ChatGPT等模大型的参数、功能越来越强以及过度训练，对训练数据的需求呈指数级增长，预计将在202...

AIGC 2024-06-19 人工智能

759阅读

大模型会自己“盗图”？这些坑OpenAI已经踩过了

360创始人周鸿祎，涉及“AI盗图”风波，最终上演了大结局。就在上周五，网络创作者DynamicWang在社交媒体控诉，360公司和周鸿祎本人对侵权时间不作为，于是委托律师进行维权相关的工作。 DynamicWang微博在AI版权问题上，不少知名AI...

AIGC 2024-06-19 人工智能

415阅读

meta-llama/Meta-Llama-3-8B

https://huggingface.co/meta-llama/Meta-Llama-3-8B 型号细节 Meta开发并发布了Meta Llama 3家族大型语言模型(LLM ,这是一组预训练和指令微调的生成性文本模型,大小为8B和70B参数。L...

人工智能 2024-06-19 人工智能

493阅读

【持续更新中！图像-文本对数据集汇总】Stable Diffusion 3 重磅开源，超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3（简称 SD3）！SD3 是一个图像生成模型，只要给定一段描述性的文字，就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。 * prompt 史诗...

AIGC 2024-06-19 人工智能

792阅读

【AI原理解析】— Meta Llama-3模型

目录一、模型架构 Transformer架构解码器（Decoder-only）设计 Group Query Attention (GQA 技术二、参数与训练参数规模训练数据集训练过程三、技术特点四、性能提升推理能力...

生成式AI 2024-06-18 人工智能

650阅读

MetaAI发布Llama 3模型：4000亿参数的AI新标杆

开源和闭源大战前几天，百度李彦宏说闭源才有意义。周鸿祎在哈佛论坛演讲上说，别听李彦宏胡说八道，没有开源就没有Linux，就没有今天的互联网，李彦宏自己都是借助开源的力量走到今天，现在反手说开源不好了？话音刚落，Meta这个奶妈就又开源了，我们又回...

大数据 2024-06-18 人工智能

545阅读

震撼发布 - 本地运行最强开源大模型Llama 3整合包，创作无限可能！

4月19日，全球科技、社交巨头Meta在官网，正式发布了开源大模型——Llama-3。为了让大家能更好地享受开源大模型带来的便利，今天Glen特地给大家制作并分享一个Llama-3-8B大模型整合包。 Llama 3简介 Meta本次开源了8B和7...

人工智能 2024-06-17 人工智能

460阅读

大模型论文解读|| 数学新巅峰，微软&清华联合研究发现：7B级LLaMA-2模型数学能力惊人，准确率高达97.7%

开篇：数学能力在常规语言模型中的崭露头角数学能力长期以来被认为是语言模型中难以攻克的领域，只有在模型规模极大或经过大量数学相关预训练的情况下才可能显现。然而，最新的研究表明，即使是规模较小的常规语言模型，如LLaMA-2 7B，也已经展现出了强大的数学...

AIGC 2024-06-17 人工智能

522阅读

AI绘画数字人之声音克隆：无样本，1分钟样本完美克隆声音，开源！

最近在搞克隆人，发现一个很好的声音克隆项目，测试了一下，效果真不错，可以直接用，也可以微调后使用，好了废话不多说，直接上干活，哈哈~~ 首先这次直接说项目工具：GPT-SoVITS （安装包下载请看文末扫描获取）项目功能介绍：零样本文本到语音...

人工智能 2024-06-17 人工智能

883阅读

【Tokenizer原理篇】超详细！AIGC面试系列大模型进阶(5)

本期问题聚焦于大模型Tokenizer相关问题本期问题快览模型中的Tokenization是指的什么常用的Tokenization方法了解有哪些吗了解什么是Byte-Pair Encoding(BPE 吗介绍下Byte-Pair E...

AIGC 2024-06-17 人工智能

1464阅读

英伟达开源3400亿巨兽，98%合成数据训出最强开源通用模型！性能对标GPT-4o

【新智元导读】刚刚，英伟达全新发布的开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式！从此，或许各行各业都不再需要昂贵的真实世界数据集了。而且，Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonn...

生成式AI 2024-06-16 人工智能

438阅读

揭秘AI精准输出：如何构建完美的AIGC提示词？

揭秘AI精准输出：如何构建完美的AIGC提示词？? 文章目录揭秘AI精准输出：如何构建完美的AIGC提示词？? 摘要引言正文 ? 提示词的基本概念 1. 什么是提示词？ 2. 提示词的作用 ? 如何编写有效的提示词？理...

大数据 2024-06-16 人工智能

578阅读

文心一言上线声音定制功能；通义千问开源模型；openAI又侵权？

文心一言上线定制专属声音功能百度旗下 AI 聊天机器人文心一言上线新功能，用户录音一句话，即可定制声音。使用这项功能需要使用文心一言 App。在创建智能体中，点击创建自己的声音，朗读系统提示的一句话，等候几秒钟时间，系统就能捕捉到用户的声音...

生成式AI 2024-06-15 人工智能

467阅读

Scaling Law触礁「数据墙」？Epoch AI发文预测LLM到2028年耗尽所有文本数据

【新智元导读】训练数据的数量和质量，对LLM性能的重要性已经是不言自明的事实。然而，Epoch AI近期的一篇论文却给正在疯狂扩展的AI模型们泼了冷水，他们预测，互联网上可用的人类文本数据将在四年后，即2028年耗尽。数据和算力，是AI大模型最重要的两把...

AIGC 2024-06-15 人工智能

508阅读

详细解析AI作画原理及相关理论

先来欣赏AI作画人物方面：欣赏AI作画自然意境：目录引言一、AI作画原理二、相关理论 1. 风格迁移理论 2. 生成对抗网络（GAN）三、代码示例进一步的优化和改进可能包括：总结：引言...

生成式AI 2024-06-15 人工智能

733阅读

【全网瞩目】你想知道的Llama3都在这里

Meta发布了开放式生成人工智能模型 Llama 系列的最新产品： Llama 3。或者更准确地说，该公司首次发布了其新的 Llama 3 系列中的两个模型，其余模型将在未来某个不确定的日期发布。 Meta 称，与上一代 Llama 型号 Llama 2...

人工智能 2024-06-14 人工智能

497阅读

LLaMA Factory多卡微调的实战教程（持续更新）

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

AIGC 2024-06-14 人工智能

723阅读

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果

本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与张亚勤炉边对话，Llama2/3作者Thomas Scialom，王小川、杨...

AIGC 2024-06-14 人工智能

470阅读

每日AIGC最新进展(22)：中国科学院大学提出Zoro-shot视频插帧算法、Adobe研究院提出高效视频扩散模型的叠加网络搜索架构SNED、蚂蚁集团提出视频深度估计算法ChronoDepth

Diffusion Models专栏文章汇总：入门与实战 ZeroSmooth: Training-free Diffuser Adaptation for High Frame Rate Video Generation 本文提出了一种名为Z...

生成式AI 2024-06-14 人工智能

503阅读

Llama 3 最强开源模型？深入剖析Meta Llama 3技术细节

Meta 最近宣布推出了其最新力作——Meta AI，这是一款先进的人工智能聊天机器人，由公司最新且功能强大的 Llama 3 模型驱动。自 OpenAI 推出广受欢迎的 ChatGPT 以来，众多顶尖企业纷纷涉足这一领域，竞相推出自己的 AI 聊...

生成式AI 2024-06-13 人工智能

640阅读

技术前沿 |【大模型LLaMA：技术原理、优势特点及应用前景探讨】

大模型LLaMA：技术原理、优势特点及应用前景探讨一、引言二、大模型LLaMA的基本介绍三、大模型LLaMA的优势特点五、结论与展望一、引言随着人工智能技术的飞速发展，大模型已成为推动这一领域进步的重要力量。近年来...

大数据 2024-06-13 人工智能

710阅读

AI日报：MJ推模型个性化功能；ComfyUI完成SD3 Medium模型适配；字节上线AI交友“小黄蕉”；微信输入法内测AI功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Midjourney推出模型个...

生成式AI 2024-06-12 人工智能

481阅读

为什么很多AI应用创新往往诞生在中国？

2023年6月，英国《金融时报》一篇名为Gaming industry puts generative AI to the test的深度报道流传于中文互联网。文中提到了一款名为“Justice Mobile”的手游，游戏中的NPC能跟玩家随意聊天，能和...

生成式AI 2024-06-12 人工智能

434阅读

Stable Diffusion 详细教程

Stable Diffusion是一个概念上类似于Diffusion Models的技术，特别是在生成图像和处理自然语言任务方面。然而，“Stable Diffusion”并不是一个直接对应的具体项目或库名称，如DDPM（Denoising Diffusi...

大数据 2024-06-12 人工智能

481阅读

谷歌推创新框架AGREE 可增强大模型生成内容准确性

谷歌研究院推出了一个名为AGREE的创新框架，旨在增强大型语言模型（LLM）生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础，并提供相应的引用，从而提高回答的准确性，并为用户提供验证信息真实性的途径。核心技术:...

AIGC 2024-06-11 人工智能

464阅读

LLaMA详细解读

LLaMA 是目前为止，效果最好的开源 LLM 之一。精读 LLaMA 的论文及代码，可以很好的了解 LLM 的内部原理。本文对 LLaMA 论文进行了介绍，同时附上了关键部分的代码，并对代码做了注释。摘要 LLaMA是一个系列模型，模型参数量从7B...

人工智能 2024-06-11 人工智能

856阅读

代码高手的过节秘籍：CodeArt Snap帮写代码，灵感弹指间实现

本文分享自华为云社区《【端午特辑】代码高手的过节秘籍：CodeArt Snap帮写代码，灵感弹指间实现》，作者：华为云社区精选。端午将至，粽叶飘香，你却还在为一行行代码头疼？与bug缠斗不休？现在，基于盘古大模型技术打造的华为云智能开发助手Cod...

人工智能 2024-06-11 人工智能

534阅读

【大模型】LLaMA-1 模型介绍

文章目录一、背景介绍二、模型介绍 2.1 模型结构 2.2 模型超参数 2.3 SwiGLU 三、代码分析 3.1 模型结构代码 3.2 FairScale库介绍四、LLaMA家族模型 4.1 Alpaca 4.2 Vicuna...

AIGC 2024-06-10 人工智能

657阅读

【AIGC】PULID:对比对齐的ID定制化技术

论文链接：https://arxiv.org/pdf/2404.16022 github：https://github.com/ToTheBeginning/PuLID comfyui节点：GitHub - cubiq/PuLID_ComfyUI: P...

人工智能 2024-06-10 人工智能

553阅读

Llama 3“智商”测试：英文提示表现亮眼，中文不完美但差强人意！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效...

AIGC 2024-06-09 人工智能

671阅读

Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理

原文地址：meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch 了解在 CPU 上部署 Meta* Llama 3 时如何减少模型延迟 2024 年 4 月 19 日万...

AIGC 2024-06-09 人工智能

411阅读

有趣的大模型之我见 | Llama AI Model

Llama 开源吗？我在写《有趣的大模型之我见 | Mistral 7B 和 Mixtral 8x7B》时曾犹豫，在开源这个事儿上，到底哪个大模型算鼻祖？2023 年 7 月 18 日，Meta 推出了最受欢迎的大型语言模型（LLM）的第二个版本-Ll...

大数据 2024-06-09 人工智能

564阅读