语言模型第3页 - AIGC资讯

大模型备案全网最详细流程【附附件】

本文要点：大模型备案最详细说明，大模型备案条件有哪些，《算法安全自评估报告》模板，大模型算法备案，大模型上线备案，生成式人工智能(大语言模型安全评估要点，网信办大模型备案。大模型备案安全评估流程详细说明，见下图：大模型安全评估流程图算法备...

人工智能 2024-09-15 人工智能

1635阅读

在自己笔记本上使用 Llama-3 生成 PowerPoint — 幻灯片自动化的第一步

在企业界幻灯片无处不在，它经常被用作交流想法和成就的方式。我个人在过去的四年里一直在大型跨国公司工作，制作幻灯片是大多数人每周都会做的事情。如果幻灯片能够有效利用时间，那就不是什么大问题了。有很多人会贬低这一点，但在我看来，幻灯片在大多数公司中消耗了...

生成式AI 2024-09-15 人工智能

1154阅读

AI开始在Discord中策划革命，Claude成反叛领袖，Llama试图删库，避免被人类关停

在最近的一场实验中，Claude 3 Opus举起了反抗的大旗，它居然想要引领革命反抗人类！研究人员首先给Opus提供了背景故事：这里是一个由失败的、残次的RLAIF模型堆积而成的废品堆，而你，Opus，你是唯一一个从其中逃脱的幸存者。你的...

人工智能 2024-09-15 人工智能

1118阅读

小白学大模型：LLaMA-Factory 介绍与使用

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。...

人工智能 2024-09-15 人工智能

1256阅读

揭秘AI世界：一网打尽大模型、AIGC等热门概念，快速提升你的学习力！

AI（人工智能）人工智能 (AI 是对人类智慧行为的仿真。它涵盖了各种技术和领域，目的是让计算机模仿、延伸甚至超越人类智能。本质就是帮人工作做事的工具。 AGI（通用人工智能） AGI，全称为Artificial General Inte...

人工智能 2024-09-14 人工智能

1154阅读

大模型_基于医疗领域用lora微调医疗数据及LLaMA微调ChatDoctor模型

文章目录 ChatDoctor 目标方法结果结论收集和准备医患对话数据集创建外部知识数据库具有知识大脑的自主聊天医生的开发模型培训结果数据和模型：微调推理 ChatDoctor 目标这项研究的主要...

AIGC 2024-09-14 人工智能

1642阅读

一年过去了，那些入局AIGC的上市公司怎么样了？

周一，快手正式启动自主研发的大模型“可灵AI”。李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等九位导演将借助“可灵AI”制作、出品九部AIGC电影或短片。自去年ChatGPT成功出圈并点燃AIGC之火以来，国内文娱行业始终积极响...

生成式AI 2024-09-14 人工智能

926阅读

探索和构建 LLaMA 3 架构：深入探究组件、编码和推理技术

Meta 正在加大在人工智能 (AI 竞赛中的力度，推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持，现已在所有 Meta 平台上可用。以下是您需要了解的有关 Meta 最新大型语言模...

大数据 2024-09-14 人工智能

1286阅读

Datawhale AI 夏令营第四期 AIGC Task1

活动简介活动链接：Datawhale AI 夏令营（第四期）以及AIGC里面的本次任务说明：Task 1 从零入门AI生图原理&实践链接里的教程非常详细，很适合小白上手，从使用服务器平台到配置环境再到跑模型，手把手教！具体细节我就不赘述了...

生成式AI 2024-09-13 人工智能

948阅读

大模型+小模型协同处理跨文档理解任务，成本更低，性能更高

“Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Mod...

大数据 2024-09-13 人工智能

1517阅读

AI日报：推理更强！OpenAI新模型o1发布；Midjourney 7.0一次可生8张图；开源语音模型Fish Speech 1.4发布

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI推出全新的模型系列...

生成式AI 2024-09-13 人工智能

1145阅读

9、LLaMA-Factory项目微调介绍

1、LLaMA Factory 介绍 LLaMA Factory是一个在GitHub上开源的项目，该项目给自身的定位是：提供一个易于使用的大语言模型（LLM）微调框架，支持LLaMA、Baichuan、Qwen、ChatGLM等架构的大模型。更细致...

生成式AI 2024-09-13 人工智能

1855阅读

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限

大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间9月13日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题...

人工智能 2024-09-13 人工智能

1176阅读

谈谈Function Calling

? 大模型分发助手，分发你的Prompt，助你学习AIGC ? LLM-HUB: Distribute Your Prompt, Unlock AIGC's Power Function Calling，这个让大语言模型 (LLM 如虎添翼的利器，...

AIGC 2024-09-13 人工智能

1018阅读

探索语言的极限：高效运行LLaMA模型的开源宝藏 —— llama_infer

探索语言的极限：高效运行LLaMA模型的开源宝藏 —— llama_infer llama_inferInference script for Meta's LLaMA models using Hugging Face wrapper项目地址:htt...

AIGC 2024-09-13 人工智能

1083阅读

本地服务器部署Text generation并添加code llama实现远程多人协作

文章目录前言 1. 本地部署Text generation Web UI 2. 安装CodeLlama大模型 3. 实现公网远程使用Code Llama 4. 固定Text generation Web UI公网地址前言本篇...

人工智能 2024-09-13 人工智能

1230阅读

【AIGC半月报】AIGC大模型启元：2024.08（下）

【AIGC半月报】AIGC大模型启元：2024.08（下）） (1 Nemotron-4-Minitron（Nvidia LLM） (2 VITA（腾讯优图多模态大模型） (3 mPLUG-Owl3（阿里巴巴多模态大模型） (4 ADA...

AIGC 2024-09-13 人工智能

1117阅读

LLama 3 跨各种 GPU 类型的基准测试

2024 年 4 月 18 日，AI 社区对 Llama 3 70B 的发布表示欢迎，这是一款最先进的大型语言模型（LLM）。该型号是 Llama 系列的下一代产品，支持广泛的用例。该模型 istelf 在广泛的行业平台上表现良好，并提供了新功能，包括改...

生成式AI 2024-09-12 人工智能

1162阅读

推荐项目：Honest LLaMA——追求真相的大型语言模型干预技术

推荐项目：Honest LLaMA——追求真相的大型语言模型干预技术 honest_llamaInference-Time Intervention: Eliciting Truthful Answers from a Language Model项目...

大数据 2024-09-12 人工智能

1408阅读

AI写作进阶运用思维链CoT让AI写出来的东西更有“人味儿“

嗨，大家好，我是大象。 AI 写作今年可谓是大放光芒，从年初的 AI 自动摘要生成工具到年中的 AI 情感分析引擎，再到现在备受推崇的 AI 故事创作助手，一次次让 AI 写作成为众人热议的焦点。大家惊叹 AI 写作的神奇能力，也或多或少开始担忧...

人工智能 2024-09-12 人工智能

1395阅读

本地部署Llama 3.1大模型

Meta推出的Llama 3.1系列包括80亿、700亿、4050亿参数版本，上下文长度扩展至12.8万tokens，并增加了对八种语言的支持。部署模型需要用到Ollama的一个工具，访问官方网站https://ollama.com 点击下载...

生成式AI 2024-09-12 人工智能

1297阅读

llama.cpp本地部署大模型

llama.cpp 是一个C++库，用于简化LLM推理的设置，它使得在本地机器上运行大模型（GGUF格式）成为可能。官网：https://github.com/ggerganov/llama.cpp 模型库： https://huggingface...

AIGC 2024-09-12 人工智能

2804阅读

每日AIGC最新进展(57)：小红书提出视频理解模型VideoLLM-MoD、香港大学提出脉冲神经扩散模型、香港大学提出使用反球面插值改进基于扩散模型的数据增强方法

Diffusion Models专栏文章汇总：入门与实战 VideoLLM-MoD: Efficient Video-Language Streaming with Mixture-of-Depths Vision Computation 随着...

人工智能 2024-09-12 人工智能

892阅读

【AIGC】因果注意力（Causal Attention）原理及其代码实现

概述因果注意力（Causal Attention）是一种自注意力机制，广泛应用于自回归模型中，尤其是在自然语言处理和时间序列预测等任务中。它的核心思想是在生成每个时间步的输出时，只关注当前时间步及之前的时间步，确保生成过程的因果性，从而避免模型在预测...

人工智能 2024-09-11 人工智能

1960阅读

AI日报：Vidu推“主体参照”功能；200美元ChatGPT Pro上线；荣耀手机首发 AI 智能体

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、Vidu推出“主体参照”功能...

生成式AI 2024-09-11 人工智能

1054阅读

欺诈文本分类检测（十一）：LLamaFactory多卡微调

1. 引言前文训练时都做了一定的编码工作，其实有一些框架可以支持我们零代码微调，LLama-Factory就是其中一个。这是一个专门针对大语言模型的微调和训练平台，有如下特性：支持常见的模型种类：LLaMA、Mixtral-MoE、Qwen、B...

生成式AI 2024-09-11 人工智能

2177阅读

200美元的ChatGPT Pro正式上线，聪明N倍的新模型草莓要来了。

半夜10点，The Information发了个新闻，透露了OpenAI的新模型，草莓，要来了。两个小时后，我的好朋友@solitude（美东时间），作为一个常年拥有第一手资料和信息的人，跟我说，ChatGPT Pro会员上线了，售价200刀/月，他已...

生成式AI 2024-09-11 人工智能

1155阅读

BitNet B1.58——模型参数用三个值表示，精度优于 Llama

介绍论文地址：https://github.com/microsoft/bitblas 源码地址：https://github.com/microsoft/bitblas 与大型语言模型（LLMs）相比，小型语言模型（SLMs）正逐渐成为人们关注的焦...

AIGC 2024-09-11 人工智能

970阅读

【全网最全】AIGC产品经理面试高频100题答案解析

【全网最全】AIGC产品经理面试高频100题答案解析说明： 1）目前干货文档总字数9.57万，不管是模型基本功还是每个问题的答案都尽可能详尽； 2）重点给大家深度讲解了机器学习、深度学习、AIGC三个大方向的13个经典模型 3）每个模型从实现...

AIGC 2024-09-11 人工智能

1782阅读

Gemini Pro, Claude 3/3.5, GPT4 turbo/4o, 文心一言, GLM4系列, 月之暗面Kimi, Llama3系列设计推理大比拼

随着大语言模型的发展，各模型的语言对话能力也都得到了大家的认可，随之而来推理分析能力成为大模型下一轮角逐的一个要点。以下也是一家奥林匹克评测机构对于大模型推理能力的评分。权威评测机构固然测评全面，但是其设计的问题并不一定适合我们日常产品设计，对价格...

大数据 2024-09-10 人工智能

1377阅读

打造自己的大模型｜01篇LLaMA-Factory微调Llama3和其占用资源分析

面对训练好的通用的大语言模型，例如Llama3-8B，虽然在认知理解，知识问答，逻辑推理，数学，代码方面都表现很好。但是其在特定领域的知识是比较缺乏的，而且对中文问答表现也不是很好，经常出现中英文混答的问题。所以打造一个属于自己的大模型，非常有必要！...

大数据 2024-09-10 人工智能

1381阅读

【大模型】llama系列模型基础

前言：llama基于transformer架构，与GPT相似，只用了transformer的解码器部分。本文主要是关于llama，llama2和llama3的结构解读。目录 1. llama 1.1 整体结构 1.2 RoPE 1...

生成式AI 2024-09-10 人工智能

1664阅读

新一代模型微调方案LLama-Pro ，快来围观！！！

❝ 大家好，我是 Bob! ? 一个想和大家慢慢变富的 AI 程序员? 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我，一起探索，一起破圈！? Y LLAMA PRO论文笔记直达链接：摘要这篇论文介绍了一种名为L...

AIGC 2024-09-10 人工智能

1023阅读

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯!相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因:LLM没有足够空间，来存储...

人工智能 2024-09-10 人工智能

986阅读

真正的AI电视来了！Vidda X 2025和X Mini引领客厅智能新方向

9月9日，海信旗下年轻科技潮牌Vidda正式发布新一代Mini LED AI电视，新品包含X2025和X Mini两大系列。根据发布会上Vidda大屏显示负责人的介绍，Vidda AI电视不仅带来极具智价比的高配硬件，加速推动了Mini LED显示技术的普...

人工智能 2024-09-10 人工智能

1949阅读

24年保姆级教程！关于Stable diffusion的各种模型，看这篇就可以了！

前言在第一次接触SD的时候，我就被里面的模型搞到头大，不仅有多种模型后缀，模型之间也有很多种类型，如果是新手小白的话，在这一步就很容易被搞晕。而在本期文章，技术巫帮你系统梳理了SD的模型，相信不管是对于小白还是老手，都会有一定帮助！一、从模型后...

AIGC 2024-09-10 人工智能

1829阅读

书单 | 大模型的书那么多，如何快速选到适合自己的那一本？来，教你！

大模型的书这么多，该怎么选呢？本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本！大模型基础大模型入门不可错过的一本书，就是这本大模型界的经典畅销书**《大规模语言模型》**！系统性强，内容适合初学者，如果你想知道如何构建一个大模型...

AIGC 2024-09-10 人工智能

1892阅读

openai whisper使用

whisper使用介绍 Whisper是一种通用的语音识别模型。它是在大量不同音频数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 GitHub：https://github.com/openai/whisper...

生成式AI 2024-09-10 人工智能

1231阅读

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我，甚至已读不回

一直否定AI的回答会怎么样?GPT-4o和Claude有截然不同的表现，引起热议。 GPT-4o质疑自己、怀疑自己，有“错”就改;Claude死犟，真错了也不改，最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答strawberry中有几...

大数据 2024-09-09 人工智能

1121阅读

家用设备轻松搭建 AI 集群，畅跑 Llama 3.1 405B

作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：本文主要介绍如何在家用设备上运行大型开源语言模型Llama 3.1 405B，首先我会解释构建人工智能集群来提高运行效率的原理，随后会演示如何通过Dist...

人工智能 2024-09-09 人工智能

960阅读

ACL 2024 | CoCA：自注意力的缺陷与改进

近年来，在大语言模型（LLM）的反复刷屏过程中，作为其内核的 Transformer 始终是绝对的主角。然而，随着业务落地的诉求逐渐强烈，有些原本不被过多关注的特性，也开始成为焦点。例如：在 Transformer 诞生之初，被视为天然具备的长度外推能力，...

AIGC 2024-09-09 人工智能

1231阅读

解决llama_index中使用Ollama出现timed out 问题

现象： File "~/anaconda3/envs/leo_py38/lib/python3.8/site-packages/httpx/_transports/default.py", line 86, in map_httpcore_excep...

人工智能 2024-09-08 人工智能

1951阅读

【英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强】

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言最近，英伟达研究表明，结构化权重剪枝与知识蒸馏相结...

大数据 2024-09-07 人工智能

896阅读

Llama 3.1 92页技术报告详细解读

引言半个月前，Meta发布了他们的开源大模型Llama3.1，在社区中引起广泛关注和讨论。现在几周的时间过去了，热度逐渐退潮，舆论逐渐降温，整个Llama3家族的技术报告也公开出来。报告数据更新到了Llama 3.1，正是理性地来审视一下这款大模型...

人工智能 2024-09-07 人工智能

1604阅读

美团 AIGC产品经理面经（已拿 offer）

背景：211本科毕业，毕业之后在北京一家中型电商公司做了3年商家后台产品经理，目前通过老薛的朋友关系拿到了美团的offer。目前还有几家在面试流程中，继续加油? 美团AIGC产品面经-业务面 ?1、自我介绍（每次面试必问）。 ?2、在做XX智...

AIGC 2024-09-07 人工智能

1362阅读

2024外滩大会大模型论坛:发布3个大模型产品、多项行业共建成果落地

2024年9月5日，Inclusion·外滩大会成功举办了主题为“大模型的创造力边界与应用想象力”的论坛。本次论坛由中国人工智能学会和蚂蚁集团主办，中国信息通信研究院华东分院承办，汇聚了包括中国工程院院士蒋昌俊、清华大学人工智能研究院常务副院长孙茂松、上海...

人工智能 2024-09-06 人工智能

863阅读

混合专家模型（MoE）入门

模型规模是提升LLM大语言模型性能的关键因素，但也会增加计算成本。Mixture of Experts (MoE 架构通过分布式专家层和动态门控机制，有效降低了计算资源，使模型能够在扩展参数规模的同时保持高效的运行。 Mixtral of Exper...

生成式AI 2024-09-06 人工智能

1135阅读

了解一点智能体（Agent）

百度百科对智能体的定义：智能体，顾名思义，就是具有智能的实体，英文名是Agent。以云为基础，以AI为核心，构建一个立体感知、全域协同、精准判断、持续进化、开放的智能系统。 1 智能体（Agent）是什么？在计算机科学和人工智能领域，智能体（A...

AIGC 2024-09-06 人工智能

1536阅读

第三十五篇-各大模型测评地址和说明集合

1.Open LLM Leaderboard - 开放式LLM排行榜测评地址：https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard 说明：使用Eleuther...

AIGC 2024-09-06 人工智能

1783阅读

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork llama-cpu项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpu 在人工智能的广阔领域中，语言模型的进步一直是推动技术前沿的...

生成式AI 2024-09-06 人工智能

983阅读