数据集第18页 - AIGC资讯

用 Unsloth 微调 LLaMA 3 8B

用 Unsloth 微调 LLaMA 3 8B 今年4月份，Meta 公司发布了功能强大的大型语言模型（LLM）Llama-3，为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而，传统的 LLM 微调过程既耗时又耗费资...

生成式AI 2024-06-14 人工智能

1079阅读

Autodesk公布AIGC 3D建模工具Bernini | 最新快讯

5 月 8 日，Autodesk 公布了一个名为 Project Bernini 的研究项目，并展示了该项目的初步能力。按照 Autodesk 给出的说法，Project Bernini 是聚焦为设计和制作行业研发生成型 AI 的研究，首次试验模...

AIGC 2024-06-13 人工智能

719阅读

探索艺术新边界：Stable Diffusion 在艺术领域的创新应用

一、引言在当今数字化时代，人工智能技术的飞速发展正在改变着各个领域，艺术领域也不例外。Stable Diffusion 作为一种强大的人工智能绘画工具，为艺术家们提供了全新的创作可能性。本文将探讨 Stable Diffusion 在艺术领域的应用，以...

生成式AI 2024-06-13 人工智能

714阅读

Llama 3 最强开源模型？深入剖析Meta Llama 3技术细节

Meta 最近宣布推出了其最新力作——Meta AI，这是一款先进的人工智能聊天机器人，由公司最新且功能强大的 Llama 3 模型驱动。自 OpenAI 推出广受欢迎的 ChatGPT 以来，众多顶尖企业纷纷涉足这一领域，竞相推出自己的 AI 聊...

生成式AI 2024-06-13 人工智能

960阅读

ApsaraMQ Copilot for RocketMQ：消息数据集成链路的健康管家

作者：文婷引言如何正确使用消息队列保证业务集成链路的稳定性，是消息队列用户首要关心的问题。ApsaraMQ Copilot for RocketMQ 从集成业务稳定性、成本、性能等方面帮助用户更高效地使用产品。背景消息队列产品通过异步消...

人工智能 2024-06-13 人工智能

765阅读

Llama 3 模型上下文长度扩展至1048K

AI苏妲己： Gradient AI 近日宣布，通过其创新的渐进式训练方法，成功将 Llama 3 系列模型的上下文长度扩展至超过100万令牌。 Llama 3 模型最初设计用于处理8000个令牌的上下文长度，这大约相当于6000字或10页文档。为了适...

AIGC 2024-06-12 人工智能

795阅读

Stable Diffusion 详细教程

Stable Diffusion是一个概念上类似于Diffusion Models的技术，特别是在生成图像和处理自然语言任务方面。然而，“Stable Diffusion”并不是一个直接对应的具体项目或库名称，如DDPM（Denoising Diffusi...

大数据 2024-06-12 人工智能

787阅读

AIGC系列之：GroundingDNIO原理解读及在Stable Diffusion中使用

目录 1.前言 2.方法概括 3.算法介绍 3.1图像-文本特征提取与增强 3.2基于文本引导的目标检测 3.3跨模态解码器 3.4文本prompt特征提取 4.应用场景 4.1结合生成模型完成目标区域生成 4.2结合stable di...

大数据 2024-06-12 人工智能

2120阅读

每日AIGC最新进展(2)：中国风景视频生成大模型、通过视频生成与 3D 对象进行基于物理的交互、无分类器指导权重调度器分析

Diffusion Models专栏文章汇总：入门与实战 ConCLVD: Controllable Chinese Landscape Video Generation via Diffusion Model 中国山水画是中国文化艺术...

AIGC 2024-06-12 人工智能

703阅读

谷歌推创新框架AGREE 可增强大模型生成内容准确性

谷歌研究院推出了一个名为AGREE的创新框架，旨在增强大型语言模型（LLM）生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础，并提供相应的引用，从而提高回答的准确性，并为用户提供验证信息真实性的途径。核心技术:...

AIGC 2024-06-11 人工智能

689阅读

谷歌Deepmind表示开放式AI是实现超级智能的关键

谷歌 Deepmind 的研究人员表示，AI 系统具备开放式的能力是发展超级智能的关键。他们认为，单纯依靠不断扩大的数据集并不足以实现超级人工智能（ASI），而现有的规模化策略往往集中在使用更多的计算资源和数据。相反，AI 系统必须能够以开放式的方式产生新...

人工智能 2024-06-11 人工智能

749阅读

LLMs之Llama3：基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3-

LLMs之Llama3：基于Colab平台(免费T4-GPU 利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】对llama-3-8b-Instruct-bnb-4bit模型采用alpa...

AIGC 2024-06-11 人工智能

948阅读

AIGC未来展望：AI将如何改变内容创作

AIGC未来展望：AI将如何改变内容创作 1.背景介绍 1.1 内容创作的重要性在当今时代,内容创作无疑已成为一项关键的生产力。无论是营销、教育、娱乐还是其他领域,高质量的内容都是吸引受众、传播信息、实现价值的关键。然而,创作优秀内容需要大量的时间...

大数据 2024-06-10 人工智能

777阅读

【AIGC调研系列】浙大&蚂蚁OneKE大模型知识抽取框架是什么

浙大&蚂蚁OneKE大模型知识抽取框架是由蚂蚁集团和浙江大学联合研发的，它是一个具备中英文双语、多领域多任务泛化知识抽取能力的大模型知识抽取框架。OneKE不仅提供了完善的工具链支持，还以开源形式贡献给了OpenKG开放知识图谱社区[1][2][3...

大数据 2024-06-10 人工智能

1117阅读

【大模型】LLaMA-1 模型介绍

文章目录一、背景介绍二、模型介绍 2.1 模型结构 2.2 模型超参数 2.3 SwiGLU 三、代码分析 3.1 模型结构代码 3.2 FairScale库介绍四、LLaMA家族模型 4.1 Alpaca 4.2 Vicuna...

AIGC 2024-06-10 人工智能

988阅读

20K star！搞定 LLM 微调的开源利器LLaMA Factory

20K star！搞定 LLM 微调的开源利器LLaMA Factory 关于LLM 微调优化型技术计算型技术 LLaMA Factory 是什么使用 LLaMA Factory 模型导出 LLaMA-Factory 结构总结项目...

AIGC 2024-06-10 人工智能

1074阅读

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

随着自然语言处理（NLP）技术的飞速发展，大型语言模型（LLMs）在各个领域都展现出了强大的能力。LLaMA 2作为其中的佼佼者，具有巨大的潜力。然而，如何有效地对LLaMA 2进行微调，以适应特定的任务或数据集，成为了一个关键问题。本文将对LoRA技术与...

人工智能 2024-06-10 人工智能

798阅读

2024年AIGC行业研究：多模态大模型与商业应用

2024年2月，OpenAI发布其首款视频生成模型Sora，用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频，与一年前的AI生成视频相比，在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大...

AIGC 2024-06-10 人工智能

828阅读

RAFT：引领 Llama 在 RAG 中发展

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

生成式AI 2024-06-10 人工智能

775阅读

快速入门大模型技术与应用，推荐你从Stable Diffusion开始学起

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注世界是变化的，分子是...

大数据 2024-06-09 人工智能

875阅读

【AIGC调研系列】llama3微调具体案例

Llama3的微调可以通过多种方式进行，具体案例包括：使用XTuner进行微调，尝试让Llama3具有"它是SmartFlowAI打造的人工智能助手"的自我认知。这涉及到准备自我认知训练数据集，并通过脚本生成数据[2][8]。利用Unsloth和G...

人工智能 2024-06-09 人工智能

1006阅读

Stable Diffusion XL（未待完续）

模型介绍 Stable Diffusion XL 是一种基于人工智能的图像生成模型，由Stability AI开发。它是Stable Diffusion系列模型中的一员，专门设计用来生成更高质量的图像。这个模型在原有的Stable Diffusion模型...

AIGC 2024-06-09 人工智能

1066阅读

llama-factory SFT 系列教程 (四)，lora sft 微调后，使用vllm加速推理

文章目录文章列表：背景简介 llama-factory vllm API 部署融合 lora 模型权重 vllm API 部署 HuggingFace API 部署推理 API 部署总结 vllm 不使用 API 部署，直接推理...

AIGC 2024-06-09 人工智能

1638阅读

Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理

原文地址：meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch 了解在 CPU 上部署 Meta* Llama 3 时如何减少模型延迟 2024 年 4 月 19 日万...

AIGC 2024-06-09 人工智能

713阅读

为Stable Diffusion模型瘦身并达到SOTA！LAPTOP-Diff：剪枝蒸馏新高度（OPPO）

文章链接：https://arxiv.org/pdf/2404.11098 在AIGC时代，对低成本甚至设备端应用扩散模型的需求日益增加。在压缩Stable Diffusion模型（SDM）方面，提出了几种方法，其中大多数利用手工设计的层移除方法来获得更...

AIGC 2024-06-09 人工智能

959阅读

有趣的大模型之我见 | Llama AI Model

Llama 开源吗？我在写《有趣的大模型之我见 | Mistral 7B 和 Mixtral 8x7B》时曾犹豫，在开源这个事儿上，到底哪个大模型算鼻祖？2023 年 7 月 18 日，Meta 推出了最受欢迎的大型语言模型（LLM）的第二个版本-Ll...

大数据 2024-06-09 人工智能

979阅读

AI | LLaMA-Factory 一个好用的微调工具

‘’ LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问，使用体验友好。此外，它还提供了由 Hiyouga 提供的 Hugging Face 空间，可...

AIGC 2024-06-08 人工智能

1272阅读

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！

最强开源大模型Llama 3发布！最大版本是4000亿参数规模！性能直逼GPT-4！当地时间4月18日，Meta 官宣发布其最新开源大模型 Llama 3。目前，Llama 3 已经开放了 80亿和 700亿两个小参数版本，上下文窗口为8K。未来...

大数据 2024-06-08 人工智能

1118阅读

Stable Diffusion 模型演进：LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。合集：持续火爆！！...

生成式AI 2024-06-08 人工智能

1070阅读

探索未来网页浏览的新型助手——WebLlama

探索未来网页浏览的新型助手——WebLlama 项目地址:https://gitcode.com/McGill-NLP/webllama ?‍? WebLlama ? 构建能遵循指令并与您对话的网络浏览代理 | ? GitHub | ?...

生成式AI 2024-06-08 人工智能

830阅读

Diffusion Model, Stable Diffusion, Stable Diffusion XL 详解

文章目录 Diffusion Model 生成模型 DDPM概述向前扩散过程前向扩散的逐步过程前向扩散的整体过程反向去噪过程网络结构训练和推理过程训练过程推理过程优化目标详细数学推导数学基础向前扩散过程反向...

大数据 2024-06-08 人工智能

1606阅读

Stable Diffusion XL之使用Stable Diffusion XL训练自己的AI绘画模型

文章目录一 SDXL训练基本步骤二从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型 2.1 配置训练环境与训练文件 2.2 SDXL训练数据集制作 (1 数据筛选与清洗 (2 使用BLIP自动标注cap...

生成式AI 2024-06-07 人工智能

2677阅读

全新推理框架SymbCoT 让大模型实现类人的符号逻辑推理能力

新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT（Symbolic Chain-of-Thought）的全新推理框架，旨在提升大语言模型(LLMs 的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链，极大提升...

AIGC 2024-06-07 人工智能

895阅读

Galileo发布Luna，重新定义GenAI评估，成本降低97%、速度提升11倍

企业人工智能技术领先者 Galileo 近日发布了一款名为 Luna 的全新产品，这一革命性的 Evaluation Foundation Models 套件重新定义了企业对 GenAI 系统的评估方式。Luna 承诺在速度、成本和准确性方面进行了前所未有...

生成式AI 2024-06-07 人工智能

733阅读

【AIGC调研系列】Phi-3 VS Llama3

2024-04-24日发布的Phi-3系列模型在多个方面展现出了对Llama-3的性能优势。首先，Phi-3-small（7B参数）在MMLU上的得分高于Llama-3-8B-Instruct模型，分别为75.3%和66%[1]。此外，具有3.8B参数的P...

生成式AI 2024-06-07 人工智能

754阅读

实测完快手的AI视频「可灵」后，我觉得这才是第一个中国版Sora

昨天，6月6号，是快手的13周年生日。在这一天，所有AI圈的人都想不到，快手在13周年之际，没有任何预兆、没有任何宣传，直接发布了他们的AI视频大模型。可灵。给我也干了个措手不及。我当时正在看360的发布会，突然手机就叮叮当当一顿狂响，打开一看，...

大数据 2024-06-07 人工智能

743阅读

基于阿里云PAI部署LLaMA Factory 完成Llama3低代码微调和部署

一、引言阿里云人工智能平台 PAI 提供了面向开发者与企业的深度学习工程平台，其中交互式建模 PAI-DSW 集成了 Jupyter 等多种云端开发环境，提供丰富的计算资源与镜像环境，实现开箱即用的高效开发模式。LLaMA Factory 则是一款...

大数据 2024-06-07 人工智能

1374阅读

AIGC-常见图像质量评估MSE、PSNR、SSIM、LPIPS、FID、CSFD，余弦相似度----理论＋代码

持续更新和补充中…多多交流！参考:图像评价指标PNSR和SSIM函数 structural_similarity图片相似度计算方法总结 MSE和PSNR MSE:...

大数据 2024-06-07 人工智能

1808阅读

LLM微调技术LoRA图解

译者 | 朱先忠审校 | 重楼简介当涉及到大型语言模型时，微调可能是人们讨论最多的技术方面的内容之一。大多数人都知道，训练这些模型是非常昂贵的，需要大量的资本投资;所以，看到我们可以通过采用现有的模型并用自己的数据对模型进行微调，从而创建一个具有...

人工智能 2024-06-06 人工智能

770阅读

使用Python实现深度学习模型：序列到序列模型（Seq2Seq）

本文分享自华为云社区《使用Python实现深度学习模型：序列到序列模型（Seq2Seq）》，作者： Echo_Wish。序列到序列（Seq2Seq）模型是一种深度学习模型，广泛应用于机器翻译、文本生成和对话系统等自然语言处理任务。它的核心思想是将一个序...

人工智能 2024-06-06 人工智能

758阅读

【AI应用开发全流程】使用AscendCL开发板完成模型推理

给开发者套件上电后 Step4 登录开发者套件通过PC共享网络联网（Windows）：控制面板 -> 网络和共享中心 -> 更改适配器设置 -> 右键“WLAN” -> 属性 ->...

人工智能 2024-06-06 人工智能

746阅读

首次证实白盒Transformer可扩展性！马毅教授CRATE-α：鲸吞14亿数据，性能稳步提升

在过去的几年里，Transformer架构在自然语言处理（NLP）、图像处理和视觉计算领域的深度表征学习中取得了显著的成就，几乎成为了AI领域的主导技术。然而，虽然Transformer架构及其众多变体在实践中取得了巨大成功，但其设计大多是基于经验的，...

人工智能 2024-06-06 人工智能

660阅读

Github万星！北航发布零代码大模型微调平台LlamaFactory

在人工智能领域，大语言模型（LLMs）已成为推动技术进步的关键力量。它们在理解和生成自然语言方面展现出了卓越的能力，从而在问答系统、机器翻译、信息提取等多样化任务中发挥着重要作用。然而，要将这些模型适配到特定的下游任务中，通常需要进行微调（fine-tun...

人工智能 2024-06-06 人工智能

1010阅读

快速学会一个算法，CNN

今天给大家分享一个超强的算法，CNN 卷积神经网络（Convolutional Neural Network，CNN）是一种深度学习模型，广泛应用于图像和视频分析、自然语言处理和其他相关领域。CNN 通过模拟生物视觉系统的处理方式，能够自动学习数据的层次...

大数据 2024-06-06 人工智能

890阅读

LightGBM实战+随机搜索调参：准确率96.67%

大家好，我是Peter~ 今天给大家分享一下树模型的经典算法：LightGBM，介绍算法产生的背景、原理和特点，最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法在机器学习领域，梯度提升机（Gradient Boosting...

大数据 2024-06-06 人工智能

968阅读

LLM | Yuan 2.0-M32：带注意力路由的专家混合模型

图片一、结论写在前面 Yuan 2.0-M32，其基础架构与Yuan-2.0 2B相似，采用了一个包含32位专家的专家混合架构，其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器，以更高效地选择专家，相比采用经典路由网络的模型，其准...

人工智能 2024-06-06 人工智能

832阅读

基于机器学习的金融欺诈检测模型

作者 | 陈峻审校 | 重楼引言如今，基于互联网服务的欺诈案例时常登顶媒体头条，而使用在线服务和数字交易的金融行业尤其成为了重灾区。网络洗钱、保险欺诈、网银盗用、虚假银行交易等复杂金融欺诈行为层出不穷，我们亟待通过行之有效的欺诈识别与检测的...

生成式AI 2024-06-06 人工智能

1245阅读

别再说国产大模型技术突破要靠 Llama 3 开源了

近日，千呼万唤之下，Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本，再次震动 AI 圈。 Meta 表示，Llama 3 已经在多种行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型...

生成式AI 2024-06-06 人工智能

699阅读

重磅 Llama-3最强开源大模型惊艳亮相

重磅！Llama-3，最强开源大模型正式发布！     202年4 月 19 日，Meta 发布开源大模型 Llama-3，助力研究人员和开发者推进语言 AI 的界限。强大的语言模型Llama-3推出，拥有80亿...

人工智能 2024-06-05 人工智能

1051阅读

CLIP当RNN用入选CVPR：无需训练即可分割无数概念｜牛津大学&谷歌研究院

循环调用CLIP，无需额外训练就有效分割无数概念。包括电影动漫人物，地标，品牌，和普通类别在内的任意短语。牛津大学与谷歌研究院联合团队的这项新成果，已被CVPR 2024接收，并开源了代码。团队提出名为CLIP as RNN（简称CaR）的新技...

大数据 2024-06-05 人工智能

748阅读