llm 第41页 - AIGC资讯

微软首次推出27亿参数的Phi-2模型，性能超过许多大型语言模型

微软发布了一款名为Phi-2的人工智能模型，该模型表现出了不凡的能力，其性能可媲美甚至超越规模是其25倍的、更大、更成熟的模型。微软在近日的一篇博文中宣布，Phi-2是一个拥有27亿参数的语言模型，与其他基础模型相比，它在复杂的基准测试中表现出了 "先...

AIGC 2023-12-13 人工智能

822阅读

如何在Python中使用ChatGPT API处理实时数据

译者 | 李睿审校 | 重楼 OpenAI公司推出的GPT如今已经成为全球最重要的人工智能工具，并精通基于其训练数据处理查询。但是，它不能回答未知话题的问题，例如： 2021年9月之后的近期事件非公开文件来自过去谈话的信息当用户处...

人工智能 2023-12-13 人工智能

877阅读

由谷歌著名人工智能论文两位共同作者创立的 Essential AI 获得 5700 万美元融资

据彭博新闻报道，由两位谷歌资深人士创立的人工智能初创公司 Essential AI 已从隐秘状态中浮现，获得了 5650 万美元的新融资。 Essential AI 开发了一项名为「企业大脑」的技术，该技术可以利用 AI 执行企业职能，如数据分析，并自动...

人工智能 2023-12-13 人工智能

901阅读

微软发文：27 亿参数的 Phi-2 AI 模型性能优于谷歌 32 亿参数的 Gemini Nano-2

12 月 13 日消息，微软公司今天发布新闻稿，表示旗下的 Phi-2 2.7B 模型，在多个方面都优于谷歌发布的 Gemini Nano-2 3.2B。 Phi-2 2.7B 模型 IT之家今年 11 月报道，微软在 Ignite 2023 大会上，宣...

生成式AI 2023-12-13 人工智能

772阅读

Cohere发布“构建自己的连接器” 助企业利用Slack、Google Drive数据构建AI

近日，Cohere发布了“构建自己的连接器（build-your-own connectors）”功能，该功能允许企业安全地连接存储在Slack、Google Drive等第三方应用上的公司数据到其大型语言模型(Command LLM 。据称，这是一项独特...

大数据 2023-12-13 人工智能

876阅读

LLaMA及其子孙模型概述

文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性，对...

大数据 2023-12-13 人工智能

1032阅读

llama.cpp部署通义千问Qwen-14B

llama.cpp是当前最火热的大模型开源推理框架之一，支持了非常多的LLM的量化推理，生态比较完善，是个人学习和使用的首选。最近阿里开源了通义千问大语言模型，在众多榜单上刷榜了，是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llam...

人工智能 2023-12-13 人工智能

1657阅读

LLM-LLaMA中文衍生模型：Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】

GitHub：GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 中文LLaMA模型...

人工智能 2023-12-13 人工智能

962阅读

【Video-LLaMA】增强LLM对视频内容的理解

Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...

生成式AI 2023-12-13 人工智能

1285阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...

人工智能 2023-12-13 人工智能

798阅读

【云上探索实验室】编程范式变革进行时——CodeWhisperer实践全流程及测评分析报告

目录一、基于LLM的辅助编程——编程范式变革进行时二、CodeWhisperer + VS Code 安装与配置 2.1、扩展安装 2.2、配置三、CodeWhisperer实践全流程 3.1、CodeWhisperer基础实验...

AIGC 2023-12-13 人工智能

1003阅读

训练自己的Llama 2！大模型微调技术介绍

训练自己的Llama 2！大模型微调技术介绍趋动云趋动云是面向 AI 算法工程师的开发平台，为工程师提供模型开发、模型训练、数据和代码管理等功能。近期有不少粉丝问算力君，趋动云是否支持大模型的训练？当然支持！最近大火的Llama...

AIGC 2023-12-12 人工智能

1499阅读

专家表示:OpenAI的Q* 可能在某些活动中 “比任何人都更好”

Q* 近日，有关OpenAI可能实现人工智能突破的猜测愈演愈烈，这一被称为Q*的潜在突破被认为可能在某些活动中“超越任何人”。Xenesis创始人兼首席科学家Tirath Virdee在接受Yahoo Finance UK采访时表示，Q*的发展有望使人工智...

AIGC 2023-12-12 人工智能

841阅读

ChatGPT的训练数据可以通过“偏离攻击”进行泄露

ChatGPT等大语言模型（LLM）使用来自图书、网站及其他来源的海量文本数据进行训练，通常情况下，训练它们所用的数据是一个秘密。然而，最近的一项研究揭示：它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。随后，来自谷歌Deep...

生成式AI 2023-12-12 人工智能

854阅读

智谱AI发布中文 LLM 对齐评测基准AlignBench

智谱AI发布了专为中文大语言模型（LLM）而生的对齐评测基准AlignBench，这是目前第一个针对中文大模型的评测基准，能够在多维度上细致评测模型和人类意图的对齐水平。 AlignBench 的数据集来自于真实的使用场景，经过初步构造、敏感性筛查、参考答...

大数据 2023-12-12 人工智能

868阅读

AI视野：Pika1.0首批用户资格揭晓；Runway官宣下场通用世界模型；妙鸭相机推出AI修图；抖音正式上线AI创作功能

???AI新鲜事 Pika1.0首批用户资格揭晓 Pika Labs最新视频生成产品Pika1.0引起轰动，已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色，提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。...

生成式AI 2023-12-12 人工智能

1029阅读

2024年AI趋势看这张图，LeCun：开源大模型要超越闭源

2023 年即将过去。一年以来，各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时，另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀？是否能够媲美专有模型的性能？迄今为止，我们一直还只能说...

生成式AI 2023-12-12 人工智能

790阅读

开源大模型超越GPT-3.5！爆火MoE实测结果出炉，网友：OpenAI越来越没护城河了

一条神秘磁力链接引爆整个AI圈，现在，正式测评结果终于来了：首个开源MoE大模型Mixtral 8x7B，已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。（对，就是传闻中GPT-4的同款方案。）并且由于是稀疏模型，处理每个toke...

人工智能 2023-12-12 人工智能

849阅读

UCLA推出Chameleon框架大模型表格数学推理准确率达98.78%

在NeurIPS2023上，UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具，包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块，解决了大型语言模型在实时信息获取和数学推理方面的不足。 Chameleon的核...

人工智能 2023-12-12 人工智能

885阅读

构建更好的基于LLM的应用程序的四大秘诀

作者 | Adrien Treuille 译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）自从OpenAI发布首个ChatGPT模型以来，人们对生成式AI的兴趣激增。基于大语言模型（LLM）的应用程序现处于企业...

大数据 2023-12-12 人工智能

1154阅读

表格数学推理准确率达98.78%！UCLA推出全新「变色龙推理框架」

在自然语言处理任务中取得显著成就的大型语言模型（LLMs）尽管表现出色，但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。为了应对这些挑战，来自UCLA等机构的研究人员打造了全新的Chameleon框架，其独特的即插即用模型融合了多种工具，包括...

大数据 2023-12-12 人工智能

895阅读

Runway官宣下场通用世界模型！解决视频AI最大难题，竟靠AI模拟世界？

【新智元导读】Runway突然发布公告，宣称要开发通用世界模型，解决AI视频最大难题，未来要用AI模拟世界。最近AI视频赛道的Pika1.0大火，两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果。面对Pika的步步紧逼，本以为R...

AIGC 2023-12-12 人工智能

853阅读

467亿参数MoE追平GPT-3.5！爆火开源Mixtral模型细节首公开，中杯逼近GPT-4

今天，Mistral AI正式放出了Mixtral 8x7B的技术细节—— 在大多数基准测试中，Mixtral的表现不仅优于Llama 2 70B，而且推理速度提高了整整6倍！尤其是，它在大多数标准基准测试上与GPT-3.5打平，甚至略胜一筹。新开源...

AIGC 2023-12-12 人工智能

852阅读

阿里研究部门推出了专为东南亚量身定制的AI大模型SeaLLM

阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能（AI）大语言模型(LLM ，凸显了该公司在更广泛地区发展市场的雄心。阿里巴巴研究部门表示，东南亚LLM（SeaLLM）在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅...

AIGC 2023-12-12 人工智能

873阅读

当GPT-4V充当机器人大脑，可能你都没AI会规划

GPT-4V 已经能帮我们设计网站代码，控制浏览器，这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界，让它作为控制机器人的大脑，会有什么有趣的结果呢？最近，来自清华大学交叉信息研究院的研究者提出「ViLa」算法，实现了让 GPT-4...

大数据 2023-12-12 人工智能

847阅读

为Gemini AI大模型找场景谷歌Project Ellman项目曝光

谷歌团队提出一个设想，用AI技术处理用户照片及搜索引擎查询信息，全面分析出用户的生活是怎样的，这个项目名叫“Project Ellmann”。按照最初的设想，Project Ellmann会用LLM（比如Gemini）提取信息，从用户的照片中找到特定...

人工智能 2023-12-12 人工智能

804阅读

LLM之Prompt（二）：清华提出Prompt 对齐优化技术BPO

论文题目：《Black-Box Prompt Optimization: Aligning Large Language Models without Model Training》论文链接：https://arxiv.org/abs/2311.041...

大数据 2023-12-12 人工智能

985阅读

微软视频编辑工具 Clipchamp 迎来新功能，包含 AI 自动创作、AI 文本转语音

IT之家 12 月 12 日消息，微软于 2021 年收购了 Clipchamp，这是一款易于使用的基于 Web 的视频编辑工具。随后，Clipchamp 被纳入 Microsoft 365 个人版和家庭版订阅计划中。最近，微软将 Clipchamp 扩...

AIGC 2023-12-12 人工智能

901阅读

OpenAI 宣布近期修复 GPT-4“变懒”问题，将在离线评估及 A / B 测试后更新模型

IT之家 12 月 12 日消息，OpenAI 在上周遭到部分用户投诉，许多用户声称，他们在使用 ChatGPT 或 GPT-4 API 时，会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题，OpenAI 承认了这一事实，并在声称将彻底、妥当...

大数据 2023-12-12 人工智能

807阅读

如何用文心一言开发前端代码

随着chatGPT的火爆，大家越来越认识到到语言大模型的潜力，国内的类chatGPT的生成式语言大模型（LLM）也如雨后春笋般冒出来。如今大家都在探索各种prompt的技巧，其实从我个人看来，LLM其实也是一种检索模型，只不过它的检索粒度更加细致，更加语...

AIGC 2023-12-12 人工智能

996阅读

研究人员发出警告：ChatGPT 不适合获取医疗信息，可能会误导公众

IT之家 12 月 11 日消息，一项新的研究显示，ChatGPT 可能并不适合用来获取医疗信息。长岛大学的研究人员向 ChatGPT 询问了 39 个与药物相关的问题，这些问题都是来自该大学药学院药物信息服务中心的真实问题。随后，他们将 ChatG...

人工智能 2023-12-11 人工智能

811阅读

ChatGPT 已经成为过去,在您的笔记本电脑中免费运行 Llama 2(源码含模型)

指示：现在您可以在计算机本地运行 ChatGPT 和 LLaMA-2。Meta刚刚发布了这个拥有700亿参数的模型，比任何其他Open模型都要好，甚至击败了Falcon 40B！为此，您需要打开终端，转到项目文件夹，然后 git clone ll...

人工智能 2023-12-11 人工智能

821阅读

ChatGPT模型在神经学考试中表现出色，超越人类学生水平

近期发表在JAMA Network Open期刊的一项研究中，研究人员评估了两个ChatGPT大型语言模型（LLMs）在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现，其中一个...

大数据 2023-12-11 人工智能

786阅读

夸张！EMNLP投稿近5000篇，奖项出炉：北大、腾讯摘最佳长论文

EMNLP 是自然语言处理领域的顶级会议之一，EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。因为今年 ChatGPT 的爆火带动大模型、NLP 概念，EMNLP 2023 的投稿论文数量也达到近 5000 篇，甚至略高于 AC...

生成式AI 2023-12-11 人工智能

928阅读

像调鸡尾酒一样调制多技能大模型，智源等机构发布LM-Cocktail模型治理策略

随着大模型技术的发展与落地，「模型治理」已经成为了目前受到重点关注的命题。只不过，在实践中，研究者往往感受到多重挑战。一方面，为了高其在目标任务的性能表现，研究者会收集和构建目标任务数据集并对大语言模型（LLM）进行微调，但这种方式通常会导致除目标任务...

生成式AI 2023-12-11 人工智能

808阅读

LLM-SFT，新微调数据集-MWP-Instruct(多步计算 + 一、二元方程)，微调Bloom, ChatGLM, LlaMA(支持QLoRA, TensorBoardX)

LLM-SFT 中文大模型微调(LLM-SFT , 支持模型(ChatGLM, LlaMA, Bloom , 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX , 支持(微调, 推理, 测评, 接口等. 项目...

大数据 2023-12-11 人工智能

911阅读

戴尔技术推动AI与生成式AI策略，存储技术加速前行

戴尔技术近日宣布，通过引入新的企业数据存储技术，与Nvidia DGX SuperPod AI基础设施进行验证，助力客户实现更快的AI和生成式AI性能。戴尔 Technologies基础设施解决方案集团总裁Arthur Lewis表示:“存储性能对于成功的...

大数据 2023-12-11 人工智能

867阅读

除了《AI 法案》，欧盟还将对 GPT-4 等更高能力模型增加额外规则约束

12 月 10 日消息，本周末，欧盟就全球首个 AI 监管法案“AI Act”达成初步协议，涉及包括 ChatGPT 在内的通用人工智能系统，这被视为世界上第一个全面监管 AI 的关键一环。综合《财富》杂志、彭博社当地时间周六晚上报道，根据彭博社获得...

生成式AI 2023-12-11 人工智能

853阅读

LangChain开源AnythingLLM：可与任何内容聊天的私人ChatGPT

今日，LangChain正式开源全栈应用程序AnythingLLM，为用户提供了构建私有ChatGPT的便利。无论是使用商业的现成LLM（Large Language Models），还是流行的开源LLM和VectorDB解决方案，您都可以轻松地在本地或远...

AIGC 2023-12-11 人工智能

997阅读

欧盟就监管生成式 AI 工具达成初步协议：迄今为止同类“最全面”规则

12 月 9 日消息，综合《华盛顿邮报》、Engadget 等外媒报道，在世界各地争相应对 AI 快速发展带来的风险之际，欧盟官员当地时间周五达成了一项具有“里程碑意义”的协议 ——《人工智能法案》（AI Act）的临时协议。这将是该地区对 AI 最全...

生成式AI 2023-12-11 人工智能

760阅读

谷歌发布Cloud TPU v5p和AI超级计算机:人工智能处理能力飞跃

谷歌在推出其张量处理单元Cloud TPU v5p和具有突破性的超级计算机架构AI Hypercomputer时掀起了轩然大波。这些创新的发布，再加上资源管理工具Dynamic Workload Scheduler，标志着在处理组织的人工智能任务方面迈出了...

大数据 2023-12-11 人工智能

834阅读

杭州一公司开出20万月薪/320万年薪抢人！ChatGPT掀起AI热潮，AIGC人才被爆抢

5年工作经历，博士学位，最高月薪20万。最近，位于杭州未来科技城一家公司，开出了最高320万年薪，招聘AIGC方向算法工程师一名。 ChatGPT在全球掀起了AI热潮，国内互联网大厂纷纷加入战局打造国内版ChatGPT。很多人在担心失业的同时，AI人...

大数据 2023-12-11 人工智能

804阅读

2023人工智能工程五大新方向

除了LLM的大量增加，AI开发工具也有了扩展。我们来看一下今年AI开发中的五个关键趋势。译自Top 5 AI Engineering Trends of 2023，作者 Richard MacManus 是The New Stack的高级编辑，专注于W...

生成式AI 2023-12-11 人工智能

865阅读

基于 AIGC，RocketMQ 学习社区探索开源软件学习新范式

AIGC 持续火爆全球，越来越多的场景开始接入并体现非凡的价值。其中应用广泛的场景之一就是智能知识问答，它改变了人们学习的方式，从阅读式到问答式，让知识的获取更加精准有效。开源软件拥有着广泛的求知群体，AIGC+ 社区的结合是学习型社区未来演进...

人工智能 2023-12-11 人工智能

891阅读

京东AIGC实战项目复盘；第一门AI动画系统课程；百川智能启动2024校园招聘；Kaggle 2023 AI前沿报告 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 李彦宏宣布「文心大模型4.0」正式发布，并开启邀请测试 10月17日，李彦宏在百度世界2023上宣布「文心大模型4.0」正式发布，表示这是迄今为止最强...

大数据 2023-12-11 人工智能

857阅读

导出LLaMA ChatGlm2等LLM模型为onnx

通过onnx模型可以在支持onnx推理的推理引擎上进行推理，从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖，获得更好的性能等优势。这篇博客（大模型LLaMa及周边项目（二） - 知乎）进行了llama导出onnx的开创性...

AIGC 2023-12-10 人工智能

1362阅读

一条磁力链接席卷AI圈，87GB种子直接开源8x7B MoE模型

「高端」的开源，往往采用最朴素的发布方式。昨天，Mistral AI 在 X 平台甩出一条磁力链接，宣布了新的开源动作。没有长篇官方博客，没有刻意加速的 Demo，这家公司算是当下大模型领域的「一股清流」。打开一看，发现是接近 87 GB 的种子...

生成式AI 2023-12-10 人工智能

912阅读

一文读懂常用的 “生成式 AI 框架”

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - Gen AI ，即“生成式 AI” 技术。随着 AI 技术的不断发展，Gen AI 的力量超越了单纯的技术奇迹，更是一种具有变革性的动态力量，深刻地塑造了...

人工智能 2023-12-10 人工智能

1102阅读

大模型就是「造梦机」，Karpathy一语惊人！人类才是「幻觉问题」根本原因

幻觉，早已成为LLM老生常谈的问题。然而，OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释，观点惊人，掀起非常激烈的讨论。在Karpathy看来: 另外，Karpathy的另一句话，更是被许多人奉为经典。他认为，与大模型相对的...

AIGC 2023-12-10 人工智能

956阅读

LLaMA Adapter和LLaMA Adapter V2

LLaMA Adapter论文地址： https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址： https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...

人工智能 2023-12-10 人工智能

1074阅读