大型语言模型第9页

SAP公布大量生成式AI新功能增强Datasphere平台

SAP正在推出大量的生成式AI新功能，并且这些功能将很快在SAP Datasphere平台中提供。 SAP表示，这些更新功能将使用户能够更直观地与他们的业务数据进行交互，有助于推动更智能的业务转型。新功能包括，帮助用户自动执行各种数据分析任务的copi...

大数据 2024-03-07 人工智能

810阅读

谷歌云数据库增加更多人工智能功能

谷歌云正在加强其分析和事务数据库，包括BigQuery, AlloyDB和Spanner，旨在推动其客户生成人工智能应用程序的开发。 BigQuery是谷歌云的顶级数据库，用于支持分析和人工智能工作负载，它开发了几项人工智能增强功能。首先，该公司推出了...

生成式AI 2024-03-07 人工智能

825阅读

AIGC 实战：如何使用 Ollama 开发自定义的大模型（LLM）

虽然 Ollama 提供了运行和交互式使用大型语言模型（LLM）的功能，但从头开始创建完全定制化的 LLM 需要 Ollama 之外的其他工具和专业知识。然而，Ollama 可以通过微调在定制过程中发挥作用。以下是细分说明：预训练模型选择： Oll...

AIGC 2024-03-06 人工智能

2360阅读

向英伟达发起挑战的Groq是什么来头？简单科普新型AI芯片LPU

在如今的人工智能领域，「GPU is All You Need」已经逐渐成为共识。没有充足的 GPU，连 OpenAI 都不能轻易升级 ChatGPT。不过最近，GPU 的地位也在经受挑战：一家名为 Groq 的初创公司开发出了一种新的 AI 处理器...

人工智能 2024-03-06 人工智能

986阅读

使用直接偏好优化策略微调Mistral-7b模型

译者 | 朱先忠审校 | 重楼引言通常，经过预训练的大型语言模型（LLM）只能执行下一个标记预测，这使其无法回答问题。这就解释了为什么这些基本模型还需要根据成对的指令和答案作进一步微调，最终才能够充当真正有用的人工助理。然而，这个过程仍然可能存在...

AIGC 2024-03-05 人工智能

1182阅读

老黄最新专访：芯片短缺难以结束，下个Transformer已经出现

英伟达的GPU正在吞噬这个世界。科技公司对英伟达的超级计算GPU有着近乎无尽的需求。不再是那个只为游戏显卡提供图形渲染服务的英伟达，现在的英伟达利用他的GPU开创了一个新时代：人类能够与计算机对话，计算机能够回应人类。而最终，计算机甚至可能超越人类...

AIGC 2024-03-05 人工智能

829阅读

7B模型超越GPT4-V！港科大等发布「图推理问答」数据集GITQA：视觉图可提升推理能力

图神经网络（GNNs）擅长利用图的结构信息进行推理，但它们通常需要特定于领域的调优才能达到峰值性能，这阻碍了它们在不同任务之间的泛化性。相比之下，基于大型语言模型（LLM）的图推理具有更强的跨任务和泛化能力，但它们在特定任务上的性能往往逊色于专用的图...

大数据 2024-03-04 人工智能

874阅读

只需少量计算和内存资源即可运行的小型 Llama 大模型

背景介绍在当今这个数据爆炸的时代，语言模型的训练变得越来越复杂和困难。我们需要巨大的计算资源和时间来训练一个高效的语言模型。然而，这对许多人来说并不现实。与此同时，我们也遇到了如何在有限的内存和计算资源中使用大型语言模型的挑战，特别是在边缘设备上。今...

生成式AI 2024-03-04 人工智能

843阅读

清华、哈工大提出OneBit方法：可把大模型压缩到1bit 保持 83% 性能

近期，清华大学和哈尔滨工业大学联合发布了一篇论文，成功将大模型压缩到1bit，仍保持83% 的性能。这一成果标志着量化模型领域的一次重大突破。过去，2bit 以下的量化一直是研究人员难以逾越的障碍，而这次的1bit 量化尝试，引起了国内外学术界的广泛关注。...

大数据 2024-03-04 人工智能

803阅读

如何基于 Arthur Bench 进行 LLM 评估？

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM 的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估...

人工智能 2024-03-04 人工智能

924阅读

复旦研发出“眸思”大模型：助力视障者安全出行

快科技3月3日消息，据复旦大学官微发文，复旦大学自然语言处理实验室基于多模态大模型复旦眸思”（MouSi）为视障者量身打造的听见世界”APP上线，将成为视障人士的生活助手与智能管家。 2023年上半年，复旦大学自然语言处理实验室发布了开发MOSS对话式大型...

AIGC 2024-03-03 人工智能

852阅读

【AIGC大模型】Sora--首个大型视频生成模型

Sora--首个大型视频生成模型胡锡进于2024年2月20日认为：台当局怂了新的改变世界模拟器视觉数据转换视频压缩时空补丁（Spacetime Laten Patches）视频生成扩展变压器算法和模型架构结语胡锡...

AIGC 2024-03-03 人工智能

913阅读

十分钟读完 Meta提出Llama 2模型的经典论文：Llama 2: Open Foundation and Fine-Tuned Chat Models

超越GPT-3：Meta AI发布新一代开源人工智能对话大模型Llama 2 引言：介绍 Llama 2 的发布背景和其在对话用例中的优化。随着人工智能技术的飞速发展，大型语言模型（LLMs）已经成为了人类智能助手的代表，它们在需要专业知识的复杂推理...

人工智能 2024-03-02 人工智能

1088阅读

企业如何管理生成式人工智能风险？

去年，生成式人工智能的采用率急剧上升。虽然该技术有望实现创新和生产力，但数据安全和泄露的风险却困扰着组织。与生成式人工智能相关的一些风险包括数据滥用、数据泄露和数据中毒。这是因为生成式人工智能是一种大型语言模型(LLM ，它依赖于大量数据来产生输出。随...

AIGC 2024-03-02 人工智能

817阅读

微软与前谷歌CEO支持AI对齐初创公司Synth Labs，让AI系统按人类预期工作

在人工智能软件领域，系统并不总是按照其开发者的意愿行动，这一潜在危险已经引起了一些科技巨头的关注。近期，微软与前谷歌CEO埃里克·施密特（Eric Schmidt）联手支持了一家名为Synth Labs的初创公司，致力于解决这一对齐问题。 Synth L...

大数据 2024-03-01 人工智能

885阅读

英伟达CEO呼吁建立主权AI基础设施

人工智能(AI 热潮将英伟达(Nvidia 的股价推至历史新高。英伟达的GPU是支持人工智能工作负载的重要硬件。该公司的崛起也使得英伟达创始人兼首席执行官黄仁勋在人工智能市场上的影响力更大。在最近的迪拜世界政府峰会上，黄仁勋分享了他的观点，即每个国家...

大数据 2024-03-01 人工智能

808阅读

参议员表示 AI 监管必要以解决潜在风险

美国参议员 Mark Warner（来自弗吉尼亚州）和 Todd Young(来自印第安纳州在华盛顿特区约翰斯・霍普金斯大学布隆伯格中心举行的讨论会上，就人工智能政策展开了一场广泛的对话。他们在这场由 Punchbowl News 创始人兼首席执行官 A...

AIGC 2024-03-01 人工智能

833阅读

基本概念：什么是ChatGPT和AIGC

1.背景介绍 1. 背景介绍自2012年的AlphaGo胜利以来，人工智能(AI 技术的进步速度逐年加快，尤其是自然语言处理(NLP 领域的突破性进展。ChatGPT和AIGC是近年来引起广泛关注的两个AI技术。本文将深入探讨这两个技术的核...

AIGC 2024-03-01 人工智能

843阅读

研究人员开发AI攻击方法BEAST：可在一分钟内绕过LLM防护栏

研究人员在美国马里兰大学成功开发了一种高效的方法，可以在一分钟内诱导大型语言模型（LLM）产生有害反应，他们将这一技术命名为BEAST(BEAm Search-based adversarial aTtack 。BEAST技术利用Nvidia RTX A6...

AIGC 2024-02-29 人工智能

974阅读

苹果今年将发力生成式AI领域库克：具有革命性发展潜力

在今日的股东大会上，苹果CEO蒂姆·库克宣布，公司高度重视生成式人工智能（AIGC），并认为它具有革命性的发展潜力，为此，苹果正积极在这一领域进行大规模的投资。库克强调，苹果坚信AIGC将在提高用户生产力和解决问题等方面为用户带来前所未有的变革性机会。他...

人工智能 2024-02-29 人工智能

828阅读

文心一言 —— 中国的语言大模型

引言在人工智能和自然语言处理领域，语言模型的发展正在引领一场技术革命。在这场革命中，中国的文心一言作为一颗新星，正以其独特的能力和特性引起广泛关注。文心一言的背景文心一言是中国自主开发的大型语言模型，它集合了先进的机器学习技术和大量的语料数据，...

大数据 2024-02-29 人工智能

1134阅读

LLaMA v1/2模型结构总览

LLaMA v1/2模型结构总览孟繁续目录收起结构 Group Query Attention(V2 only RMSNorm SwiGLU RoPE llama2 出来了，并且开源可商用，这下开源社区又要变天了。快速...

生成式AI 2024-02-28 人工智能

1333阅读

亚马逊云宣布Mistral AI 模型即将登陆 Amazon Bedrock

Mistral AI 是一家总部位于法国的人工智能公司，专注于将公开可用的模型提升至最先进的性能水平。他们主要致力于构建快速而安全的大型语言模型（LLM），可用于各种任务，如聊天机器人和代码生成。亚马逊云科技很高兴地宣布，Mistral AI 的两种高性...

人工智能 2024-02-28 人工智能

824阅读

你的下一个办公室助理会是机器人吗？

...

生成式AI 2024-02-27 人工智能

822阅读

微软发布PyRIT，用于识别生成式AI系统中的风险

2月26日消息，据外媒报道，微软发布了一个名为PyRIT的开放访问自动化框架，用于主动识别生成式AI系统中的风险。微软人工智能红色团队负责人Ram Shankar Siva Kumar表示，红色团队工具旨在“使全球每个组织都能利用最新的人工智能进步进...

大数据 2024-02-27 人工智能

861阅读

研究：近一半热门新闻网站屏蔽了 OpenAI 爬虫

2 月 27 日消息，一项由路透社研究所进行的研究表明，截至 2023 年底，全球 10 个国家的热门新闻网站中，近一半 (48% 屏蔽了 OpenAI 的爬虫（Crawler），而近四分之一 (24% 屏蔽了谷歌的 AI 爬虫。据IT之家了解，...

生成式AI 2024-02-27 人工智能

769阅读

ChatMusician官网体验入口 AI音乐生成语言模型在线使用地址

ChatMusician是一个开源的大型语言模型（LLM），它通过持续的预训练和微调，集成了音乐能力。该模型基于文本兼容的音乐表示法（ABC记谱法），将音乐视为第二语言。ChatMusician能够在不依赖外部多模态神经结构或分词器的情况下，理解和生成音乐...

生成式AI 2024-02-27 人工智能

851阅读

VAD v2端到端SOTA | 远超DriveMLM等方法（地平线）

从大规模驾驶演示中学习类似人类的驾驶策略是很有前途的，但规划的不确定性和非确定性本质使得这一任务充满挑战。在这项工作中，为了应对不确定性问题，作者提出了VADv2，一个基于概率规划的端到端驾驶模型。VADv2以流方式输入多视角图像序列，将传感器数据转换为...

大数据 2024-02-27 人工智能

1312阅读

基于AI开发畅销书的自助出版平台Inkitt融资3700万美元

自助出版平台Inkitt近日成功融资3，700万美元，由Khosla Ventures领投，总估值达4亿美元。该平台旨在通过人工智能（AI）将用户创作的故事转化为畅销书，并以此为基础构建21世纪的“迪士尼”。 Inkitt的应用允许用户自主出版故事，然后...

AIGC 2024-02-27 人工智能

950阅读

IBM CEO致合作伙伴：让我们“一起在AI上赚很多钱”

IBM首席执行官Arvind Krishna在接受CRN采访时预测称，今年IBM解决方案提供商将努力建立客户对AI的信任并扩展早期用例。他说：“这是行业中一个超级激动人心的时刻。我们迎来了生成式AI的新浪潮，这将为我们的客户创造商业价值，让他们有信心...

AIGC 2024-02-27 人工智能

801阅读

逻辑推理大翻车！GPT-4、Gemini被曝重大缺陷，LLM严重降智

近期，谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时，前提信息的呈现顺序对其表现具有决定性影响。在逻辑推理和数学问题中，前提按照逻辑自然顺序排列时，模型表现更佳。对于大型语言模型，改变前提叙述顺序会导致性能大幅下降，尤其是在添...

AIGC 2024-02-26 人工智能

900阅读

人工智能和数据中心：为什么人工智能如此需要资源

到2023年底，对生成式人工智能将需要多少能源的任何预测都是不准确的。例如，头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万户家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，每机架的功率密度将上升到50kW或1...

生成式AI 2024-02-26 人工智能

835阅读

AI崛起加剧数据中心能源消耗，谷歌新技术或帮助减排

2月26日消息，科技巨头正竞相加紧努力拆除被称为“碳定时炸弹”的隐患，随着人工智能（AI）技术的兴起，它们在全球建立的数据中心的能源消耗也急剧上升，进而导致的碳排放问题日渐严重。因此，谷歌引领的一项创新技术逐步受到重视：该技术通过软件在全球太阳能和风...

AIGC 2024-02-26 人工智能

764阅读

掌握商业人工智能：使用 RAG 和 CRAG 构建企业级人工智能平台

通过我们的指南了解如何为您的企业释放人工智能的力量。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程。非常适合负责任地拥抱人工智能的企业。为企业打造AI-Ready平台企业在引入生成式人工智能时，会遇到许多需要战略管理的业务风险。这...

生成式AI 2024-02-25 人工智能

908阅读

AIGC专题：生成式人工智能在能源和材料领域中的新机遇

今天分享的是AIGC系列深度研究报告：《AIGC专题：生成式人工智能在能源和材料领域中的新机遇》。（报告出品方：McKinsey & Company）报告共计：11页来源：人工智能学派利用人工智能的力量 Gen Al在加速增长和降...

人工智能 2024-02-24 人工智能

850阅读

LLaMA 2 - 你所需要的一切资源

摘录关于 LLaMA 2 的全部资源，如何去测试、训练并部署它。 LLaMA 2 是一个由 Meta 开发的大型语言模型，是 LLaMA 1 的继任者。LLaMA 2 可通过 AWS、Hugging Face 等提供商获取，...

人工智能 2024-02-24 人工智能

934阅读

数学建模比赛中，使用大语言模型如chatgpt、文心一言该如何写Prompt（提示）？

在大型语言模型中，"prompt"（中文常译为“提示”或“引导”）是指提供给模型的输入文本，用于指示或引导模型产生特定的输出。它的作用主要是告诉模型用户想要得到什么样的信息或完成什么样的任务。例如，在使用大型语言模型进行文本生成时，你可以输入一个问题、...

人工智能 2024-02-24 人工智能

975阅读

AIGC从入门到入坑01（初学者适用版）

AIGC从入门到入坑系列文章 AIGC系列第一章--简述 AIGC从入门到入坑系列文章前言学习路径 AI时间线人工智能简史 AI绘画简史 AI名词解释小白从0-1必看5篇资料初学者进阶必读8篇资料总结前...

人工智能 2024-02-23 人工智能

1263阅读

借助知识图谱和Llama-Index实现基于大模型的RAG

幻觉是在处理大型语言模型（LLMs）时常见的问题。LLMs生成流畅连贯的文本，但经常产生不准确或不一致的信息。防止LLMs中出现幻觉的一种方法是使用外部知识源，如提供事实信息的数据库或知识图谱。矢量数据库和知识图谱使用不同的方法来存储和表示数据。矢量数...

生成式AI 2024-02-23 人工智能

1070阅读

WhisperFusion：具有超低延迟无缝对话功能的AI系统

WhisperFusion 基于 WhisperLive 和 WhisperSpeech 的功能而构建，在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM 。 LLM 和 Whisper 都经过优化，可作为 TensorRT 引擎高效运...

人工智能 2024-02-23 人工智能

910阅读

OpenAI回应“ChatGPT发疯”问题：token预测是根源

近期，ChatGPT意外发生失控事件，用户纷纷报告收到混乱而令人震惊的回复，引起Reddit、HN等社交平台上广泛的讨论。OpenAI迅速做出回应，确认问题源于「token预测」，并表示已成功修复。 ChatGPT用户在向模型提问时，突然发现其回复变得毫无...

生成式AI 2024-02-23 人工智能

823阅读

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因...

生成式AI 2024-02-22 人工智能

956阅读

LLaMA 2 和 QianWen-14B

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型 - 科技新闻 - EDA365电子论坛网 LLaMA 2 的硬件要求： LLaMA 2 系列模型有不同的参数量版本，如7B、13B和70B等。对于不同大小的模型，其硬件需求也有所不同。以...

生成式AI 2024-02-22 人工智能

1309阅读

今年AI可能在三个重要方面影响网络安全

从超强的社交攻击到AI驱动的个人电脑，本文探讨了AI今年将如何重塑网络安全。最近的AI进步为网络安全捍卫者和恶意行为者提供了新的工具和能力，网络犯罪分子已经开始探索AI如何加强攻击，并以新一代快速射击威胁的企业为目标，但AI也可以被永远利用——安全团...

人工智能 2024-02-22 人工智能

738阅读

都在搞端到端，试问端到端自动驾驶的基石到底是什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基础模型的出现彻底改变了自然语言处理和计算机视觉领域，为其在自动驾驶（AD）中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾，展示了基础模型在增强AD中的...

人工智能 2024-02-22 人工智能

904阅读

BentoML：如何使用 JuiceFS 加速大模型加载

BentoML 是一个开源的大语言模型（LLM） AI 应用的开发框架和部署工具，致力于为开发者提供最简单的构建大语言模型 AI 应用的能力，其开源产品已经支持全球数千家企业和组织的核心 AI 应用。当 BentoML 在 Serverless 环...

人工智能 2024-02-21 人工智能

848阅读

企业数据在生成人工智能中的关键作用

大量基于GenAI的工具和应用涌入市场。其中一些应用非常聪明且富有创意，但它们大多是ChatGPT等应用背后的大型语言模型(LLM 的包装器。这并不是要贬低LLM的语言、概念和单词关系知识可以提供新的效率和生产力的数千种潜在场景。但LLM和ChatGP...

AIGC 2024-02-21 人工智能

808阅读

【AIGC】大语言模型

大型语言模型，也叫大语言模型、大模型（Large Language Model，LLM；Large Language Models，LLMs）什么是大型语言模型大型语言模型（LLM）是指具有数千亿（甚至更多）参数的语言模型，它们是通过在大规模文本数...

生成式AI 2024-02-20 人工智能

1100阅读

2024年IT行业“龙抬头”：AI和网络安全是最大热点

IDC指出，2024年的IT市场充满机遇，尽管通胀和经济等因素带来隐忧，但整体增长势头强劲。数字化的浪潮推动着对结构化数据和人工智能(AI 的需求，企业逐渐意识到数据带来的巨大价值，以及利用AI和自动化管理数据、进行高级数据处理的重要性。 IDC市场研...

大数据 2024-02-19 人工智能

928阅读

Nomic AI 发布首个完全开源的长文本嵌入模型，超越 OpenAI Ada-002在各项基准测试中的表现

在自然语言处理（NLP）领域不断发展的背景下，理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力，特别是通过文本嵌入的发展。这些嵌入成为许多应用的基础，包括大型语言模型(LLMs 的检索增强生成和语义搜索。它们将句子或文档转换为低维向...

人工智能 2024-02-18 人工智能

1313阅读