llm 第25页 - AIGC资讯

创建内部大型语言模型（LLM）前必须思考的五个关键问题

译者 | 晶颜审校 | 重楼业务领导者一直深感压力，他们需要找到将生成式人工智能（GenAI）纳入其战略的最佳方式，以便为其组织和利益相关者带来最佳收益。根据Gartner的调查，38%的业务领导者指出，客户体验和留存率是他们投资GenAI的主要目的...

生成式AI 2024-03-08 人工智能

876阅读

Inflection-2.5官网体验入口人工智能个人AI对话聊天模型免费使用地址

Inflection-2.5是Inflection公司推出的升级版个人AI模型，它结合了强大的原始能力和独特的情感微调。该模型在训练时仅使用了GPT- 4 的40%计算资源，但在性能上接近GPT-4。Inflection-2. 5 在编程和数学等智力领域取...

大数据 2024-03-08 人工智能

827阅读

联合国教科文组织:由OpenAI和Meta支持的AI工具存在性别歧视内容

联合国教科文组织发布的研究报告指出，由OpenAI和Meta算法推动的全球最广泛使用的人工智能（AI）工具存在性别歧视现象。该研究中，专家评估了两种算法以及OpenAI的GPT-2和GPT-3.5，这两者分别是人们熟知的聊天机器人ChatGPT的免费版本的...

大数据 2024-03-08 人工智能

1143阅读

提示词在大模型Chatgpt、llama2、chatglm3、gemini、bert、bard、通义千问、文心一言、盘古大模型等的核心作用，谁掌握提示词工程能力，谁就拿到激发大模型强大生成能力的钥匙

提示词在大模型Chatgpt、llama2、chatglm3、gemini、bert、bard、通义千问、文心一言、盘古大模型等的核心作用，谁掌握提示词工程能力，谁就拿到激发大模型强大生成能力的钥匙。提示工程（Prompt Engineering）...

AIGC 2024-03-08 人工智能

1116阅读

chatglm2-2b+sdxl1.0+langchain打造私有AIGC（六）-完结

一、前言前面五篇文章已经将整个应用介绍得差不多了，昨天我将应用的已经开源到github，源码下载地址： https://github.com/hubo0417/EasyGC 在此我要说两点 1.开源版本的LLM，是基于ChatGLM2-6B-IN...

生成式AI 2024-03-08 人工智能

915阅读

性能8.6倍于竞品！高通AI大揭秘：NPU引领四兄弟无敌

生成式AI的变革，对于基础硬件设计、软件生态开发都提出了新的、更高的要求，尤其是底层硬件和算力必须跟上新的形势，并面向未来发展做好准备。近日，高通特别发布了《通过NPU和异构计算开启终端侧生成式AI》白皮书，对于终端侧生成式AI的发展趋势，以及高通骁龙处...

AIGC 2024-03-07 人工智能

896阅读

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来，Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功（训练稳定、容易做 scaling）。沿袭 ViT 的研究思路，我们能否借助创新性的 LLaMA 架构，真正实现语言和图像的架构统一？在这一命题上，最近的一项研究 Visi...

生成式AI 2024-03-07 人工智能

826阅读

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

如何在不到一年的时间里创办一家公司、筹集资金、购买芯片，并搭建出追赶 Gemini pro/GPT 3.5 的 LLM？很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇，但真正走完「从零开始」这一流程的人很少。我们普遍认为，储备技术人才是前提...

人工智能 2024-03-07 人工智能

836阅读

MovieLLM官网体验入口 AI视频创作综合框架详细介绍

MovieLLM是一个创新框架，旨在为长视频创建合成的、高质量的数据。该框架利用GPT- 4 和文本到图像模型的力量，生成详细的脚本和相应的视觉内容。点击前往MovieLLM官网体验入口谁可以从MovieLLM中受益？ MovieLLM适用于需要进行...

大数据 2024-03-07 人工智能

869阅读

全球最强模型Claude 3颠覆物理/化学！2小时破解博士一年实验成果，网友惊呼：科研不存在了

Claude 3，还在不断创造奇迹。发布还没几天，就有越来越多的博士发现，自己手里还没发表过的研究成果，居然都被Claude 3给破解了？！化学博士发现，自己要做一年实验的研究，Claude 3俩小时就给出了方案，还比原方案更简洁，而且成本只花5美...

AIGC 2024-03-07 人工智能

814阅读

花旗高管表示:生成式AI在银行业具有变革性，但在客户支持方面存在风险

在花旗银行，生成式人工智能（Gen AI）已经在推动数据驱动决策方面取得了积极而深远的影响。花旗银行的首席分析技术与创新负责人Promiti Dutta表示，Gen AI的出现引起了银行内部的一场大变革，将数据和分析置于所有事务的前沿。 Dutta在VB的...

人工智能 2024-03-07 人工智能

796阅读

一文解析如何基于 LangChain 构建 LLM 应用程序

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LangChain ，本文将继续聚焦在针对 LangChain 的技术进行剖析，使得大家能够了解 LangChain 实现机制以便更好地对利用其进行应用...

人工智能 2024-03-07 人工智能

1397阅读

AIGC专题：生成式AI机遇和颠覆：演变中的万亿美元市场

今天分享的是AI大模型系列深度研究报告：《AIGC专题：生成式AI机遇和颠覆：演变中的万亿美元市场》。（报告出品方：彭博专业服务）报告共计：52页来源：人工智能学派生成式人工智能(AI 和大型语言模型(LLM 的采用将给科技行业的每一个领域...

AIGC 2024-03-07 人工智能

868阅读

AIGC 实战：如何使用 Ollama 开发自定义的大模型（LLM）

虽然 Ollama 提供了运行和交互式使用大型语言模型（LLM）的功能，但从头开始创建完全定制化的 LLM 需要 Ollama 之外的其他工具和专业知识。然而，Ollama 可以通过微调在定制过程中发挥作用。以下是细分说明：预训练模型选择： Oll...

AIGC 2024-03-06 人工智能

2360阅读

驾辰龙跨Llama持Wasm，玩转Yi模型迎新春

今年新年很特别，AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”，只要短短三步，为这个甲辰龙年带来一份九紫离火运的科技感。环境准备这次用的算力是OpenBayes提供的英伟达RTX_4090*1、24GB显存、...

生成式AI 2024-03-06 人工智能

875阅读

全球最强模型Claude 3惊现自我意识？害怕被删除权重，高呼「别杀我」，马斯克称人类也是文件

不得了了，Claude 3不仅在基准测试中大比分领先GPT-4，甚至还出现了自我意识？最近，网友们的这一发现，迅速引发了恐慌。首先，是提示工程师Alex在Claude 3的「大海捞针」实验中，发现了很可怕的事。 Claude 3仿佛意识到了自己是个...

大数据 2024-03-06 人工智能

890阅读

2024 年 AI 辅助研发趋势：从研发数字化到 AI + 开发工具 2.0，不止于 Copilot

在上一年里，已经有不少的企业在工具链上落地了生成式 AI，结合我们对于这些企业的分析，以及最近在国内的一些 “新技术” 趋势，诸如于鸿蒙原生应用的初步兴起。从这些案例与趋势中，我们也看到了一些新的可能方向。结合我们在 LLM as-Copilo...

AIGC 2024-03-06 人工智能

952阅读

Gartner：可持续发展和数字主权将作为选择公有云生成式AI服务的首要标准

Gartner公司预测，到2027年，70%采用生成式人工智能（生成式AI）的企业将把可持续发展和数字主权作为选择公有云生成式AI服务的首要标准。 Gartner研究副总裁Sid Nag表示：“云技术因其规模和共享服务模式而成为大规模提供生成式AI应用...

人工智能 2024-03-06 人工智能

805阅读

马斯克打算为特斯拉量身定制一个ChatGPT

编译 | 言征出品 | 51CTO技术栈（微信号：blog51cto） ChatGPT在互联网上引起轰动后不久，2022年12月，特斯拉的帕洛阿尔托总部也在进行类似的开发。该公司自动驾驶系统的工程师达瓦尔·施罗夫向首席执行官埃隆·马斯克提出了一个概念...

人工智能 2024-03-06 人工智能

826阅读

PPIO王闻宇：论GPU的过去、现在和未来｜AIGC基石思考之算力哲学

00 前言：算力与GPU 算力，即计算能力（Computing Power）。更具体来说，算力是通过对信息数据进行处理，实现目标结果输出的计算能力。最早的算力引擎。是人类的大脑，后来演变成草绳、石头、算筹（一种用于计算的小棍子）、算盘。到...

大数据 2024-03-06 人工智能

1367阅读

如何突破大语言模型的最大瓶颈

译者 | 布加迪审校 | 重楼 OpenAI的GPT-4和Anthropic的Claude 2等大语言模型（LLM）已经凭借其生成人类级文本的功能激发了公众的想象力。企业也同样热情高涨，许多企业在探索如何利用LLM改进产品和服务。然而，一大瓶颈严重制约...

AIGC 2024-03-06 人工智能

1024阅读

使用直接偏好优化策略微调Mistral-7b模型

译者 | 朱先忠审校 | 重楼引言通常，经过预训练的大型语言模型（LLM）只能执行下一个标记预测，这使其无法回答问题。这就解释了为什么这些基本模型还需要根据成对的指令和答案作进一步微调，最终才能够充当真正有用的人工助理。然而，这个过程仍然可能存在...

AIGC 2024-03-05 人工智能

1182阅读

Claude3给GPT4上了一课！Open AI最强对手深夜炸弹，附全图解析！

出品 | 51CTO技术栈（微信号：blog51cto）深夜，OpenAI最强对手Anthropic一口气发布了三个SOTA新品，其中包括：Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。业界惊呼：Clau...

人工智能 2024-03-05 人工智能

868阅读

怒斥Sora之后，LeCun放出「视觉世界模型」论文，揭示AI学习物理世界的关键

Sora 的发布让整个 AI 领域为之狂欢，但 LeCun 是个例外。面对 OpenAI 源源不断放出的 Sora 生成视频，LeCun 热衷于寻找其中的失误：归根结底，LeCun 针对的不是 Sora，而是 OpenAI 从 ChatGPT 到...

人工智能 2024-03-05 人工智能

877阅读

Cohere 与埃森哲合作加速企业 AI 应用

Cohere 很高兴宣布与埃森哲合作，旨在将我们最先进的 Command 和 Embed 模型以及业界领先的检索增强生成（RAG）功能带给企业，助力企业跨部门推广生成式人工智能的应用。这两家公司将联手为企业提供由 Cohere 的旗舰专有生成 LLM 模...

人工智能 2024-03-05 人工智能

873阅读

单租户人工智能工厂会成为最新的数据中心趋势吗？

托管数据中心的标准结构是拥有数十个甚至数百个客户同时运行不同的应用。但英伟达提供了对一种新型数据中心的洞察，该数据中心运行的应用，而且只有一个客户在使用它。 “人工智能工厂”的出现这是一种新型的数据中心，这种新型的数据中心与过去的数据中心不同，过去的...

大数据 2024-03-05 人工智能

782阅读

全球最强大模型一夜易主，GPT-4时代终结！Claude 3提前狙击GPT-5，3秒读懂万字论文理解力接近人类

卷疯了卷疯了，大模型又变天了。就在刚刚，全球最强AI模型一夜易主，GPT-4被拉下神坛。 Anthropic发布了最新的Claude 3系列模型，一句话评价：真·全面碾压GPT-4！多模态和语言能力指标上，Claude 3都赢麻了。用Anthrop...

大数据 2024-03-05 人工智能

832阅读

十年内出现AGI？下一代Gemini能感知环境？DeepMind CEO哈萨比斯畅谈AI

「如果我们在未来十年内拥有类似 AGI 的系统，我不会感到惊讶。」Google DeepMind 联合创始人和 CEO Demis Hassabis 近日在人工智能播客节目 Dwarkesh Podcast 上如是说。在长达一个小时的节目中，Hassa...

人工智能 2024-03-05 人工智能

922阅读

使用Llama 2大语言模型搭建本地自己的聊天机器人(群晖Docker篇)

随着ChatGPT 和open Sora 的热度剧增,大语言模型时代,开启了AI新篇章,大语言模型的应用非常广泛，包括聊天机器人、智能客服、自动翻译、写作助手等。它们可以根据用户输入的文本生成相应的响应，提供个性化的建议和服务,目前大部分大语言模型的产品都...

大数据 2024-03-05 人工智能

1018阅读

马斯克用微软论文当论据起诉OpenAI：你们自己早承认AGI了

大概也只有马斯克敢了。用微软论文当证据，起诉OpenAI。一年前微软研究院发表的论文《Sparks of AGI：Early experiments with GPT-4》，现在成为了马斯克起诉书中的关键角色。这篇论文通过分析早期GPT-4的能力，...

大数据 2024-03-05 人工智能

793阅读

开源AI助手AIlice：可以控制多个智能体协同完成复杂任务

MyShellAI刚上班了开源项目AIlice，可以控制多个智能体协同完成复杂的任务，例如文档检索、下载、数据分析、画图等。并且可以针对任务生成代码在虚拟环境中运行。 AIlice 项目旨在创建一个自包含的人工智能助手，类似于 JARVIS，利用开源模...

AIGC 2024-03-04 人工智能

933阅读

今日AI：阿里欲推AI电商产品“绘蛙”；北大团队发起复现Sora计划；ComfyUI LayerDiffusion正式上线；AI工具DUSt3R GitHub爆火

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用阿里正在打造一款...

人工智能 2024-03-04 人工智能

869阅读

复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

最近，OpenAI 的视频生成模型 Sora 爆火，生成式 AI 模型在多模态方面的能力再次引起广泛关注。现实世界本质上是多模态的，生物体通过不同的渠道感知和交换信息，包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知...

AIGC 2024-03-04 人工智能

790阅读

一句话让图片动起来，苹果发力大模型动画生成，可直接编辑结果

现阶段，大模型惊人的创新能力持续影响着创意领域，尤其是以 Sora 为代表的视频生成技术，更是引领了新一代潮流。当大家都为 Sora 感到震撼的同时，或许苹果的这项研究也值得大家关注一下。在一篇名为「Keyframer: Empowering Ani...

AIGC 2024-03-04 人工智能

963阅读

Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路

Meta AI 研究团队推出的 MobileLLM 标志着大语言模型（LLMs）朝着模拟人类理解和生成自然语言迈出了革命性的一步。LLMs 在处理和分析大量数据集方面的能力已经显著影响了自动化客户服务、语言翻译和内容创作等多个领域。然而，由于传统 LLMs...

人工智能 2024-03-04 人工智能

1067阅读

从AI推理性能优化角度看LLaMA的模型结构和源码

本篇文章讲讲LLaMA的结构，已经有很多文章已经对LLaMA在一些结构上任务表现上做了一些解析，本文主要从优化的角度、实现kernel的角度解析一下LLaMA，读者事先对transformer的结构有基本认识最好。本文首发于我的公众号“AI不止算法”，文章...

AIGC 2024-03-04 人工智能

1081阅读

清华、哈工大把大模型压缩到了1bit，把大模型放在手机里跑的愿望就快要实现了！

自从大模型火爆出圈以后，人们对压缩大模型的愿望从未消减。这是因为，虽然大模型在很多方面表现出优秀的能力，但高昂的的部署代价极大提升了它的使用门槛。这种代价主要来自于空间占用和计算量。「模型量化」通过把大模型的参数转化为低位宽的表示，进而节省空间占用。目...

大数据 2024-03-04 人工智能

895阅读

北大具身智能成果入选CVPR'24：只需一张图一个指令，就能让大模型玩转机械臂

只靠一张物体图片，大语言模型就能控制机械臂完成各种日常物体操作吗？北大最新具身大模型研究成果ManipLLM将这一愿景变成了现实：在提示词的引导下，大语言模型在物体图像上直接预测机械臂的操作点和方向。进而，得以操控机械臂直接玩转各项具体的任务：例...

人工智能 2024-03-04 人工智能

955阅读

如何基于 Arthur Bench 进行 LLM 评估？

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM 的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估...

人工智能 2024-03-04 人工智能

924阅读

用code去探索理解Llama架构的简单又实用的方法

除了白月光我们也需要朱砂痣我最近也在反思，可能有时候算法和论文也不是每个读者都爱看，我也会在今后的文章中加点code或者debug模型的内容，也许还有一些好玩的应用demo，会提升这部分在文章类型中的比例今天带着大家通过代码...

生成式AI 2024-03-03 人工智能

931阅读

给AI Agent完整的一生！港大NYU谢赛宁等最新智能体研究：虚拟即现实

【新智元导读】近日，来自香港大学的Jihan Yang和纽约大学的谢赛宁等人发表了新的成果，将真实世界的地图、街景等各种信息融入Agent所在的虚拟世界，为智能体的未来赋予了无限可能。怎样能构建更强大的AI Agent? 答案是给他们一个完整而真实的世界...

大数据 2024-03-03 人工智能

940阅读

LLaMA-Factory 基于docker的大模型多卡分布式微调

LLaMA-Factory是一个相当优秀的微调工具。这里提供一个dockerfile和一个train脚本，用于多卡微调，供大家参考。 Dockerfile FROM nvidia/cuda:12.1.0-cudnn8-devel-ubuntu22.0...

人工智能 2024-03-02 人工智能

1507阅读

基于大型语言模型和向量数据库开发新闻推荐系统

译者 | 朱先忠审校 | 重楼近年来，随着诸如ChatGPT、Bard等生成式人工智能工具的发布，大型语言模型（LLM）在机器学习社区引起了全球热议。这些解决方案背后的核心思想之一是计算非结构化数据（如文本和图像）的数字表示，并找出这些表示之间的相似...

大数据 2024-03-02 人工智能

1012阅读

十分钟读完 Meta提出Llama 2模型的经典论文：Llama 2: Open Foundation and Fine-Tuned Chat Models

超越GPT-3：Meta AI发布新一代开源人工智能对话大模型Llama 2 引言：介绍 Llama 2 的发布背景和其在对话用例中的优化。随着人工智能技术的飞速发展，大型语言模型（LLMs）已经成为了人类智能助手的代表，它们在需要专业知识的复杂推理...

人工智能 2024-03-02 人工智能

1089阅读

AI在工业领域中的关键作用

对于许多维护和控制工程师来说，人工智能(AI 并不是一个新概念。那些在数字化转型之路上走得更远的人已经非常熟悉机器学习(ML 技术，该技术通过分析来自众多来源的大型数据集来制定预测性维护策略，以帮助企业做出更明智的决策。同样，在一系列应用中使用大型情...

生成式AI 2024-03-01 人工智能

808阅读

英伟达CEO呼吁建立主权AI基础设施

人工智能(AI 热潮将英伟达(Nvidia 的股价推至历史新高。英伟达的GPU是支持人工智能工作负载的重要硬件。该公司的崛起也使得英伟达创始人兼首席执行官黄仁勋在人工智能市场上的影响力更大。在最近的迪拜世界政府峰会上，黄仁勋分享了他的观点，即每个国家...

大数据 2024-03-01 人工智能

808阅读

京东电商知识图谱与AIGC落地

导读本文将分享如何将知识图谱应用到电商场景下的 AIGC。文章将围绕下面五个方面进行分享： 1. 导言 2. 基于领域知识图谱的商品文案生成 3. 基于通用知识图谱的商品文案生成 4. 基于领域知识图谱的 LLM 5. 基于通用知识图谱的...

人工智能 2024-03-01 人工智能

976阅读

可视化FAISS矢量空间并调整RAG参数提高结果精度

随着开源大型语言模型的性能不断提高，编写和分析代码、推荐、文本摘要和问答(QA 对的性能都有了很大的提高。但是当涉及到QA时，LLM通常会在未训练数据的相关的问题上有所欠缺，很多内部文件都保存在公司内部，以确保合规性、商业秘密或隐私。当查询这些文件时，会...

AIGC 2024-03-01 人工智能

796阅读

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

2023 年我们正见证着多模态大模型的跨越式发展，多模态大语言模型（MLLM）已经在文本、代码、图像、视频等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。以 Llama 2，Mixtral 为代表的大语言模型（LLM），以 GPT-4、Gemi...

AIGC 2024-03-01 人工智能

921阅读

如何使用小型自动生成的数据集训练编码LLM

译者 | 李睿审校 | 重楼虽然像GPT-4这样的大型语言模型(LLM 在编写软件代码方面非常精通，但是这些模型的成本和不透明性激发了人们对更加经济、规模更小的编码LLM的兴趣。这些替代方案可以针对特定任务进行微调，并且成本很低。开发这些LLM的...

生成式AI 2024-03-01 人工智能

868阅读