语言模型 - AIGC资讯

ai与能源消耗：大模型训练的碳足迹争议

标题：AI与能源消耗：大模型训练的碳足迹争议在人工智能（AI）技术日新月异的今天，大型语言模型、深度学习网络等先进算法正以前所未有的速度推动着科技进步和社会变革。然而，随着这些AI大模型性能的不断提升，其背后隐藏的能源消耗问题也逐渐浮出水面，引发了广泛的争...

AIGC 2025-06-27 人工智能

1085阅读

人工智能的算力革命：gpu vs tpu

标题：人工智能的算力革命：GPU vs TPU在人工智能（AI）领域，算力是推动技术进步的核心动力。随着深度学习模型的不断复杂化，对计算资源的需求呈现出爆炸式增长。在这场算力革命中，图形处理器（GPU）和张量处理器（TPU）作为两大核心计算平台，各自以其独...

人工智能 2025-06-27 人工智能

910阅读

自监督学习：从无标注数据中挖掘知识

自监督学习：从无标注数据中挖掘知识的艺术在人工智能领域，数据标注一直是一个既耗时又昂贵的环节。然而，随着技术的不断进步，一种名为“自监督学习”的方法正在悄然改变这一现状。自监督学习通过巧妙设计算法，使模型能够从无标注数据中自动挖掘出有价值的信息和知识，从而...

生成式AI 2025-06-26 人工智能

914阅读

数据挖掘与大语言模型（llm）的结合

标题：数据挖掘与大语言模型（LLM）的融合：开启智能分析的新篇章在信息技术日新月异的今天，数据挖掘与大语言模型（Large Language Models, 简称LLM）的结合正逐步成为推动人工智能领域发展的关键力量。这一融合不仅深化了我们对海量数据的理解...

生成式AI 2025-06-21 大数据

1079阅读

拿下诺贝尔化学奖，类谷歌AlphaFold开源蛋白质大模型

本周谷歌DeepMind联合创始人兼首席执行官Demis Hassabis凭借AlphaFold系列模型拿下诺贝尔化学奖，创造了AI大模型首次拿下诺奖的历史。尤其是最新发布的AlphaFold-3在生物分子结构、蛋白-配体结构、生物复合体等方面获得了很大...

AIGC 2024-10-13 人工智能

2591阅读

开源模型应用落地-qwen2.5-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100（十八）

一、前言本篇文章将使用LLaMA-Factory去高效微调（命令和界面方式）QWen2.5系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。 QWen2系列模型微调: 开源模型应用落...

AIGC 2024-10-12 人工智能

3939阅读

Llama 3.1大模型的预训练和后训练范式解析

Meta的Llama大型语言模型每次出新版本，都会是一大事件。前段时间他们不仅发布了3.1的一个超大型的405亿参数模型，还对之前的8亿和70亿参数的模型做了升级，让它们在MMLU测试中的表现更好了。不同模型在MMLU基准测试中的表现他们还...

人工智能 2024-10-06 人工智能

1379阅读

如何在Android上运行Llama 3.2

引言随着Llama 3.2的发布，Meta在将强大的语言模型带到边缘和移动设备方面取得了重大进展。Llama 3.2包含了专为智能手机和平板电脑高效运行而设计的轻量级模型（1B和3B参数）。本教程将指导您通过MLC LLM库对Llama 3.2模型进...

AIGC 2024-10-05 人工智能

1934阅读

大语言模型如何提升AIGC内容的质量与创意

在人工智能生成内容（AIGC）领域，大语言模型（LLMs）正成为推动创意和内容质量提升的重要工具。这些模型不仅能够生成自然流畅的文本，还可以在多种应用场景中提供灵感与创新。本文将探讨大语言模型如何通过理解语言的复杂性、模仿创意写作风格以及结合用户反馈，来提...

人工智能 2024-10-05 人工智能

1333阅读

[240929] 12 款最佳免费开源隐写工具 | Llama 3.2: 开源、可定制模型，革新边缘人工智能和视觉体验

目录 12 款最佳免费开源隐写工具 Llama 3.2: 开源、可定制模型，革新边缘人工智能和视觉体验 12 款最佳免费开源隐写工具什么是隐写术？隐写术是一种将信息隐藏在其他信息中的艺术和科学，除了发送者和预期的接收者之外，...

AIGC 2024-10-05 人工智能

1456阅读

【大模型与AIGC】VLM基础知识汇总

这里写目录标题 LLM输入时的理解 1. Tokenizer的实现：Word极大似然估计 LLM推理：关于Attention mask的理解 1. CausalModel 与 AttentionMask 2. attention mask乘法...

生成式AI 2024-10-04 人工智能

1662阅读

【人工智能绪论】一次性搞懂什么是AIGC！

? 个人主页：十二月的猫-CSDN博客 ? 系列专栏：深度学习_十二月的猫的博客-CSDN博客 ?? 十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光 ? 专栏持续更新中~~~✨ 目录 1. 前言 2. AIGC发展历程...

大数据 2024-10-04 人工智能

1573阅读

开源语音实时交互新突破：LLaMA-Omni实现大语言模型无缝语音交互

像 GPT-4o 这样的模型通过语音实现了与大型语言模型（LLMs）的实时交互，与基于文本的传统交互相比，显著提升了用户体验。然而，目前在如何构建基于开源 LLMs 的语音交互模型方面仍缺乏探索。为了解决这个问题，我们提出了 LLaMA-Omni，这是一个...

生成式AI 2024-10-04 人工智能

1752阅读

Meta发布Llama 3.2，Llama 终于能看见了！

Llama家族再添新成员，多模态能力终于到来！ Meta刚刚发布了Llama 3.2模型系列，包括多模态视觉模型和小型文本模型，共计10个开放权重模型。这次更新不仅带来了期待已久的视觉能力，还为移动设备和边缘计算提供了更多选择。多模态Llam...

生成式AI 2024-10-04 人工智能

1884阅读

llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程

llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程 llama3.cudallama3.cuda is a pure C/CUDA implementation for Llama 3 model.项目地址:https://git...

AIGC 2024-10-03 人工智能

1341阅读

`llama-journey` 开源项目安装与使用指南

llama-journey 开源项目安装与使用指南 llama-journey Experimental adventure game with AI-generated content 项目地址: https://gitcode.com/g...

人工智能 2024-10-03 人工智能

1518阅读

在矩池云使用 Llama-3.2-11B-Vision 详细指南

Llama 3.2-Vision是Meta开发的一系列多模态大型语言模型（LLMs），包含11B和90B两种规模的预训练和指令调整模型。这些模型专门优化用于视觉识别、图像推理、字幕生成和回答有关图像的一般问题。Llama 3.2-Vision模型在常见...

生成式AI 2024-10-03 人工智能

2008阅读

什么是AIGC？什么是大模型？具体有什么应用？

什么是AIGC？ AIGC，英文全称是Artificial Intelligence Generated Content，翻译成中文的大白话意思就是“人工智能生成的内容”。比如AI（Artificial Intelligence，人工智能）生成文本、图...

AIGC 2024-10-03 人工智能

1781阅读

中文法律LLaMA (Lawyer LLaMA) 使用教程

中文法律LLaMA (Lawyer LLaMA 使用教程 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/law...

人工智能 2024-10-03 人工智能

1640阅读

LLaMA-Factory 让大模型微调变得更简单！！

背景如果只需要构建一份任务相关的数据，就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作，那么必将大大减轻微调工作量。今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...

AIGC 2024-10-03 人工智能

1663阅读

Rusty Llama Webapp：用Rust打造的高效聊天机器人

Rusty Llama Webapp：用Rust打造的高效聊天机器人 rusty_llamaA simple ChatGPT clone in Rust on both the frontend and backend. Uses open sourc...

人工智能 2024-10-03 人工智能

1548阅读

Chinese-Vicuna: 一个基于LLaMA的中文指令跟随模型

Chinese-Vicuna简介 Chinese-Vicuna是一个基于LLaMA的中文指令跟随模型，由研究者开发，旨在以低资源的方式实现高效的中文语言模型训练。该项目的主要目标是构建和分享可以在单个Nvidia RTX-2080TI上训练的中文指令跟随...

生成式AI 2024-10-02 人工智能

1235阅读

【AIGC】Kolors:快手开源的文生图大模型

GitHub：GitHub - Kwai-Kolors/Kolors: Kolors Team 论文：Kolors/imgs/Kolors_paper.pdf at master · Kwai-Kolors/Kolors · GitHub comfyu...

生成式AI 2024-10-02 人工智能

1750阅读

Unsloth 教程 - 如何微调 Llama-3并导出到 Ollama

本文翻译整理自：? How to Finetune Llama-3 and Export to Ollamahttps://docs.unsloth.ai/tutorials/how-to-finetune-llama-3-and-export-to-ol...

大数据 2024-10-02 人工智能

3544阅读

什么是Agentic RAG？

Agentic RAG是检索增强生成(Retrieval-Augmented Generation, RAG 技术的一种高级形式,它通过引入人工智能代理(Agent 的概念,为语言模型赋予了更高层次的智能和自主性。以下是Agentic RAG的主要特点和优...

人工智能 2024-10-02 人工智能

1754阅读

LLaMa-Factory入门教程

LLaMa-Factory是一个基于人工智能技术的开源项目，专为大型语言模型（LLMs）的微调而设计。它提供了丰富的工具和接口，使得用户能够轻松地对预训练的模型进行定制化的训练和调整，以适应特定的应用场景。以下将详细介绍如何使用LLaMa-Factory：...

生成式AI 2024-10-02 人工智能

1694阅读

中科院提出GPT-4o实时语音交互的开源对手：Llama-Omni

论文：LLaMA-Omni: Seamless Speech Interaction with Large Language Models地址：https://arxiv.org/pdf/2409.06666 研究背景研...

生成式AI 2024-10-01 人工智能

1402阅读

AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

快科技10月1日消息，AMD发布了自己的首个小语言模型(SLM ，名为AMD-135M”。相比于越来越庞大的大语言模型(LLM ，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。 AMD-135小模型隶属于Llama家族，有两个版...

大数据 2024-10-01 人工智能

1330阅读

LLaMA- Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

发表时间：14 Jun 2023 论文链接：https://arxiv.org/pdf/2303.16199 作者单位：Shanghai Artificial Intelligence Laboratory Motivation：最近，指令跟踪模型取...

大数据 2024-10-01 人工智能

1587阅读

实习结帖（flask加上AIGC实现设计符合OpenAPI要求的OpenAPI Schema，让AIGC运行时可以调用api，协助公司门后迁移新后端等）

终于，笔者的实习生活也要告一段落了，最后的几天都在忙着和公司做AIGC的项目，在搞api的设计以及公司门户网站的迁移。牛马搬运工（牛马了3天）先说这个门户网站的迁移，我原本以为只是换个后端（若依），数据库改改就能...

大数据 2024-10-01 人工智能

1279阅读

LLaMA-Factory 安装和配置指南

LLaMA-Factory 安装和配置指南 LLaMA-Factory 易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址: https://gitcode.com/gh_m...

人工智能 2024-10-01 人工智能

5682阅读

1500+ HuggingFace API token暴露，使数百万 Meta-Llama、Bloom 等大模型用户面临风险

HugginingFace 和 GitHub 是AI开发人员的重要平台，因此我们决定对这些平台做更为深入的研究。在这项研究中，我们发现了数以千计的 API 令牌，这些令牌暴露给恶意行为者，使数百万最终用户可能受到攻击。本文的主要内容包括：...

人工智能 2024-10-01 人工智能

1464阅读

使用llama.cpp 在推理MiniCPM-1.2B模型

llama.cpp 是一个开源项目，它允许用户在C++中实现与LLaMA（Large Language Model Meta AI）模型的交互。LLaMA模型是由Meta Platforms开发的一种大型语言模型，虽然llama.cpp本身并不包含LLaM...

AIGC 2024-10-01 人工智能

1551阅读

【Llama3.1-8B-Instruct】Llama Factory 等部署实战

一、模型介绍 Meta Llama 3.1 系列是一个多语言大型语言模型 (LLM 集合，包括 8B、70B 和 405B 三种尺寸（文本输入/文本输出）。Llama 3.1 的指令调优版本（8B、70B、405B）针对多语言对话用例进行了优化，并在常...

人工智能 2024-09-30 人工智能

2981阅读

Meta Llama 3介绍及其关键技术

随着深度学习算法的突破和发展，语言模型已经成为连接人与机器的重要桥梁。在这一领域中，Meta的Llama 3 作为最新一代的大规模预训练模型，凭借其卓越的性能和广泛的应用前景，正逐渐成为行业内的佼佼者。 Llama 3 的研发团队继承了前代模型的技术优势...

AIGC 2024-09-30 人工智能

1782阅读

给AI公司“打杂”，95后华人把估值做到138亿美元

在旧金山的 Showplace 广场，一栋曾经属于Airbnb的商业大楼最近迎来了新主人。在大部分科技公司都在业务收缩的当下，Scale AI，这家由95后华人创立的人工智能数据标注公司，大手一挥租下了旧金山市中心约18万平英尺的办公室。就在不久前，Sc...

AIGC 2024-09-30 人工智能

1174阅读

使用 GaLore 预训练LLaMA-7B

项目代码： https://github.com/jiaweizzhao/galorehttps://github.com/jiaweizzhao/galore 参考博客： https://zhuanlan.zhihu.com/p/686686751...

生成式AI 2024-09-30 人工智能

1382阅读

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动

从头开始实现 LLaMA 模型，这包括设计模型架构、编写训练算法等，tl-rtc-file打破距离,局域网传输可达70MB，免费开源很火热的一些可以通过网页进行远程控制的开源项目，以及操作系统引导自动。这个开源项目名为 “llama3-from-s...

生成式AI 2024-09-30 人工智能

1280阅读

当剪映识别字幕开始收费，我们用免费开源软件FFmpeg、Whisper、ChatGPT来快速制作中文或双语字幕

最近剪映中的视频“智能提取字幕”的功能收费了，收费是按照会员功能年收费，收费还不低。由于我只需要剪映的字幕功能，其他会员功能并不需要，于是想了其他的办法来解决给视频增加字幕的功能，并且还能添加双语字幕，给中文字翻译成其他任何一门语言再加在中文幕...

AIGC 2024-09-30 人工智能

6870阅读

AIGC时代！AI的“iPhone时刻”与投资机遇

AIGC时代！AI的“iPhone时刻”与投资机遇前言 AI的“iPhone时刻”与投资机遇前言 AIGC，也就是人工智能生成内容，它就像是一股汹涌的浪潮，席卷了整个科技世界。它的出现，让我们看到了人工智能的无限潜力，也让我们...

AIGC 2024-09-30 人工智能

1191阅读

LlaMa-Factory源码解析之预训练LLaMA-Factory/src/llamafactory/train/pt/workflow.py -＞ run_pt()

LLaMA-Factory/src/llmtuner/train/pt/workflow.py at main · hiyouga/LLaMA-Factory · GitHub 截止至2024年7月，该框架workflow.py目录从LLaMA-Fact...

生成式AI 2024-09-30 人工智能

1568阅读

下载官方llama

1.官网.pth格式去官网（Download Llama (meta.com ）申请具体可以看这个B站视频 Llama2模型申请与本地部署详细教程_哔哩哔哩_bilibili（视频是llama2，下载llama3是另外一个git）相关...

生成式AI 2024-09-30 人工智能

1678阅读

Emacs Copilot 安装与使用指南

Emacs Copilot 安装与使用指南 emacs-copilotLarge language model code completion for Emacs项目地址:https://gitcode.com/gh_mirrors/em/emacs-...

AIGC 2024-09-29 人工智能

1633阅读

AI日报：文生图新顶流？神秘蓝莓模型横空出世；阿里妈妈开源AI图像修复模型；谷歌斥资27亿美元重聘AI专家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、神秘蓝莓模型横空出世:AI文生...

大数据 2024-09-29 人工智能

1260阅读

LlamaFactory可视化微调大模型 - 参数详解

LlamaFactory 前言 LLaMA Factory 是一个用于微调大型语言模型的强大工具，特别是针对 LLaMA 系列模型。可以适应不同的模型架构和大小。支持多种微调技术，如全参数微调、LoRA（ Low-Rank Adaptation...

生成式AI 2024-09-29 人工智能

2415阅读

AI视频新战场：字节对决快手、反击Sora

字节跳动以性价比策略切入市场，掀起价格竞争，但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察，其商业变现与用户场景适配性成为主要考验。一场由Sora引发的AI视频生成竞赛，如今迎来新的竞争者! 9月24日，2024火山引擎AI创新巡展...

大数据 2024-09-29 人工智能

1374阅读

【AI绘画】超详细！ComfyUI 全方位入门指南，初学者必看，附多个实践操作

本文正文字数约 8300 字，阅读时间 20 分钟。如果按照文章实操一遍，预计时间在半小时到两小时不等。在上一篇文章中，我向大家介绍了有关于 Stable Diffusion 的基本概览，同时也在文章里放置了一些相关的工具链接可以方便的使用 Stab...

人工智能 2024-09-29 人工智能

5469阅读

微软Copilot将集成到新加坡的法律科技平台中

新加坡的律师现在可以使用微软的生成式人工智能（Gen AI）工具Copilot，但在拥抱这项技术的同时，仍需牢记人工监督的重要性。 Microsoft 365的Copilot已集成到该国的法律技术平台中，该平台于2022年推出，旨在支持法律工作流程，并包...

生成式AI 2024-09-29 人工智能

1405阅读

Copilot,Cursor和通义灵码：到底谁才是你的最强代码助手？

近期基于大语言模型诞生的代码辅助助手可谓层出不穷，从一开始的github copilot, tabnine到现如今的cursor大火，到底谁才是代码辅助的最强王者呢？我希望就我近期的体验带大家初步认识一下他们（仅代表个人见解）本文将介绍以下几个工具：...

人工智能 2024-09-29 人工智能

3764阅读

利用 FP8 量化加速 Llama-3-70B 推理

本文针对在 Amazon P5 (H100 GPU 上部署 Llama-3-70b FP8 精度模型的两种方案选型（Trion 及 LMI – Large Model Inference 容器）进行了探索，同时提供了基于 FMBench 的性能评估的最佳...

AIGC 2024-09-28 人工智能

1580阅读