语言模型第22页

年薪百万美元、马斯克直呼“史上最疯狂”！大厂“AI人才战”爆发

快科技4月6日消息，近日特斯拉CEO马斯克在社交平台上发布了一系列帖子称，OpenAI正在以高薪诱惑特斯拉工程师，并且他们在某些情况下取得了成功。马斯克表示这是我见过最疯狂的人才战争”，并宣布将提高AI工程师的薪酬。 AI的快速发展也加剧了科技巨头间的竞...

生成式AI 2024-04-06 人工智能

750阅读

【AIGC调研系列】苹果MM1大模型与其他模型相比的优势和劣势

苹果MM1大模型与其他模型相比，具有以下优势和劣势：优势：多模态能力：MM1是基于大规模多模态预训练的，这意味着它能够处理和理解多种类型的数据（如文本、图像等），在上下文预测、多图像和思维链推理等方面表现出色[7][10]。少样本学习能力：...

大数据 2024-04-06 人工智能

1028阅读

龙盈智达&Fabarta：基于图智能和 AIGC 技术的金融营销解决方案

导读在金融行业的营销活动中，如何获取潜在客户以及判定企业风险是银行重点关注的方向。本方案基于 ArcGraph 图数据库和图智能分析技术，帮助企业筛选潜在客户，通过股权穿透、实控人分析自动识别风险。通过大模型企业知识中台，用户可以利用自然语言对话的方式查...

AIGC 2024-04-05 人工智能

959阅读

蔡崇信：中国AI技术可能落后美国OpenAI两年

快科技4月5日消息，据媒体报道，阿里巴巴联合创始人、董事长蔡崇信坦诚地指出，在AI技术领域，中国相较于美国存在一定的差距”。他进一步指出，与美国的顶级大型语言模型（LLM）如OpenAI ChatGPT相比，中国可能落后两年”。然而，这并不意味着中国在这一...

生成式AI 2024-04-05 人工智能

805阅读

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调文章原始地址：https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/ 引言大语...

大数据 2024-04-05 人工智能

966阅读

OpenAI发布全新微调API ：ChatGPT支持更详细可视化微调啦！

4月5日凌晨，OpenAI在官网宣布新增6个全新微调API功能，以扩展自定义模型，帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。这些功能包括:基于Epoch的检查点创建、Playground新功能、第三方集成、全面验证指标、超参数配置...

AIGC 2024-04-05 人工智能

1008阅读

llama-factory简介

llamafactory是什么，能干什么 LLaMA-Factory 是一个易于使用的大规模语言模型（Large Language Model, LLM）微调框架，它支持多种模型，包括 LLaMA、BLOOM、Mistral、Baichuan、Qwen ...

人工智能 2024-04-05 人工智能

1501阅读

华人开源最强「AI 程序员」炸场，让 GPT-4 自己修 Bug！

自从“AI 程序员”Devin问世之后，近期的一大趋势就是程序员们争先恐后地要让自己失业，试图抢先造出比自己更强大的程序员。普林斯顿大学为软件工程界迎来了一位新星——SWE-agent，论文将在4月10日正式发布，目前项目已在 GitHub 上开源。...

大数据 2024-04-04 人工智能

871阅读

群晖NAS使用Docker部署大语言模型Llama 2结合内网穿透实现公网访问本地GPT聊天服务

文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址随着ChatGPT...

大数据 2024-04-04 人工智能

986阅读

Stable Diffusion中的Embeddings

什么是Embeddings？ Embeddings是一种数学技术，它允许我们将复杂的数据（如文本或图像）转换为数值向量。这些向量是高维空间中的点，可以捕捉数据的关键特征和属性。在文本处理中，例如，embeddings可以捕捉单词或短语...

AIGC 2024-04-04 人工智能

873阅读

大模型新漏洞！Anthropic警告：新式“多轮越狱”攻破AI防线，或祸起长文本

出品 | 51CTO技术栈（微信号：blog51cto）撰稿丨诺亚如何让一个AI回答一个它本不应该作答的问题？有很多这种所谓的“越狱”技术，而Anthropic的研究人员最近发现了一种新方法：如果首先用几十个危害性较小的问题对大型语言模型（LLM）...

人工智能 2024-04-03 人工智能

920阅读

AI写作的奥秘：从困惑度到爆发度的探索之旅

大家好，小发猫降重今天来聊聊AI写作的奥秘：从困惑度到爆发度的探索之旅，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI写作的奥秘：从困惑度到爆发度的探索之旅在AI写作的领域中，困惑度和...

生成式AI 2024-04-03 人工智能

901阅读

什么是生成式AI？有哪些特征类型

生成式AI是人类一种人工智能技术，可以生成各种类型的内容，包括文本、图像、音频和合成数据。那么什么是人工智能？人工智能和机器学习之间的区别是什么？有哪些技术特征？人工智能是一门学科，是计算机科学的一个分支，研究智能代理的创建，这些智能代理是可以推理、...

AIGC 2024-04-03 人工智能

876阅读

大模型中常用的注意力机制GQA详解以及Pytorch代码实现

分组查询注意力 (Grouped Query Attention 是一种在大型语言模型中的多查询注意力 (MQA 和多头注意力 (MHA 之间进行插值的方法，它的目标是在保持 MQA 速度的同时实现 MHA 的质量。这篇文章中，我们将解释GQA的...

AIGC 2024-04-03 人工智能

837阅读

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果，然而，Transformer 中自注意力带来的二次复...

AIGC 2024-04-03 人工智能

873阅读

对话式AI助手的巅峰对决：ChatGPT与文心一言的实用价值探讨

随着人工智能技术的发展，对话式AI助手逐渐成为了人们生活中的一部分。其中，ChatGPT和文心一言更是备受关注的两款对话式AI助手。本文将探讨这两款AI助手的实用价值，并通过案例和数据的方式进行分析。一、ChatGPT的实用价值跨语言交流 C...

人工智能 2024-04-03 人工智能

1141阅读

LLM超长上下文查询-性能评估实战

在大型语言模型（LLM）的应用中，有几个场景需要以结构化的方式呈现数据，其中信息提取和查询分析是两个典型的例子。我们最近通过更新的文档和一个专门的代码仓库强调了信息提取的重要性。对于查询分析，我们同样更新了相关文档。在这些场景中，数据字段可能包括字符串、...

生成式AI 2024-04-03 人工智能

839阅读

Perplexity要搞竞价排名了，大模型的尽头……就还是广告？

还记得曾经从英伟达和贝索斯们手里融了 7360 万美元，誓要以AI驱动的透明搜索体验挑战谷歌，俘获大批社区支持者的Perplexity吗？如今，这家一直鄙视广告业务的硅谷明星AI公司，也准备开始卖广告了。作为一款会话式答案引擎，Perplexity将聊...

生成式AI 2024-04-03 人工智能

812阅读

研究发现：GPT-4在临床推理中表现优于医生，但也更经常出错

在一项新研究中，美国贝斯以色列医疗中心（BIDMC）的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的 IDEA(r-IDEA 评分，这是一种常用工具，用于评估临床推理能力。这项研究包括给予一个由 GPT-4提供支持的...

人工智能 2024-04-02 人工智能

855阅读

叠衣服、擦案板、冲果汁，能做家务的国产机器人终于要来了

将家务全部交给机器人的那一天，或许会比想象中更快到来。还记得会炒菜的斯坦福 ALOHA 机器人吗？现在，中国的初创公司自变量机器人（X Square）展示了同样令人惊艳的能力，甚至更进一步。在该公司最新展示的 Demo 中，完全基于大模型自主推理的...

人工智能 2024-04-02 人工智能

803阅读

苹果开发出新款AI：可“看懂”屏幕内容并语音回复

快科技4月2日消息，据媒体报道，苹果公司近日宣布，成功研发出一款前沿的人工智能系统ReALM（Reference Resolution As Language Modeling，即基于语言建模的参考解析）。据悉，该系统具备卓越能力，能够精准解析屏幕上模糊...

AIGC 2024-04-02 人工智能

859阅读

苹果AI放大招！声称其设备端模型性能优于GPT-4

快科技4月2日消息，据媒体报道，在最近的一篇论文中，苹果的研究团队宣称，他们提出了一个可以在设备端运行的模型ReALM，这个模型在某些方面可以超过GPT-4。 ReALM的参数量分别为80M、250M、1B和3B，体积都非常小，适合在手机、平板电脑等设备端...

人工智能 2024-04-02 人工智能

790阅读

让Siri不再智障！苹果定义新的端侧模型，“大大优于GPT-4，摆脱文本，可视化模拟屏幕信息，最小参数模型相较基线系统仍提升5%

撰稿丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）总被用户吐槽“有点智障”的Siri有救了！ Siri自诞生以来就是智能语音助手领域的代表之一，但很长一段时间里，其表现并不尽如人意。然而，苹果的人工智能团队最新...

人工智能 2024-04-02 人工智能

994阅读

更好、更安全、更不依赖OpenAI，微软的AI新动向，推出大模型安全工具Azure AI

编译丨伊风出品 | 51CTO技术栈（微信号：blog51cto）对生成性人工智能（generative AI）的需求正不断增长，而对LLM安全和可靠性的担忧也变得比以往任何时候都更加突出。企业希望能确保为内外部使用而开发的大规模语言模型（LLM）...

大数据 2024-04-02 人工智能

867阅读

Paper Digest | GPT-RE：基于大语言模型针对关系抽取的上下文学习

笔记整理：张廉臣，东南大学硕士，研究方向为自然语言处理、信息抽取链接：https://arxiv.org/pdf/2305.02105.pdf 持...

大数据 2024-04-02 人工智能

1025阅读

苹果AI放大招？新设备端模型超过GPT-4，有望拯救Siri

在最近的一篇论文中，苹果的研究人员宣称，他们提出了一个可以在设备端运行的模型，这个模型在某些方面可以超过 GPT-4。具体来说，他们研究的是 NLP 中的指代消解（Reference Resolution）问题，即让 AI 识别文本中提到的各种实体...

大数据 2024-04-02 人工智能

860阅读

性能强，成本低，运行快！最强开源大模型出现，超越ChatGPT和Llama！

大数据人工智能公司 Databricks放大招了！ 3月27日，该公司开源了通用大模型 DBRX，并声称该模型是迄今为止全球最强大的开源大型语言模型，比 Meta 的 Llama 2 更为强大。 GPT-3.5研究测试： https://huj...

大数据 2024-04-02 人工智能

912阅读

阿里7B多模态文档理解大模型拿下新SOTA

多模态文档理解能力新SOTA！阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5，针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战，提出了一系列解决方案。话不多说，先来看效果。复杂结构的图表一键识别转换为M...

生成式AI 2024-04-02 人工智能

965阅读

快速理解AIGC图像控制利器ControlNet和Lora的架构原理

作者公众号大数据与AI杂谈（TalkCheap），转载请标明出处 ControlNet以及Lora是什么，玩过stable diffusion AI图像生成的同学应该都不陌生。一般来说，如果你用以SD 或 SDXL为基础的模型来生成图像，产出的图...

人工智能 2024-04-02 人工智能

1593阅读

教育领域大模型技术与应用

苏喻博士，高级工程师，合肥人工智能研究院副研究员，原科大讯飞AI 教育研究院副院长，中国科学技术大学博士后，安徽省青少年信息学教育专委会秘书长，CCF 大专委-通讯委员，合肥市 D 类人才。苏喻博士一直在智慧教育方向深耕，聚焦于青少年编程。面对数据稀疏...

大数据 2024-04-02 人工智能

1366阅读

集体出走的Stability AI 发布全新代码大模型，3B以下性能最优，超越Code Llama和DeepSeek-Coder

Stability AI又有新动作！程序员又有危机了？ 3月26日，Stability AI推出了先进的代码语言模型Stable Code Instruct 3B，该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...

AIGC 2024-04-02 人工智能

952阅读

马斯克开源 Grok：参数量近 Llama 四倍，成全球最大开源模型

本周一，马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok，这也兑现了他上周的开源承诺。截至目前，Grok 已经在 GitHub 上获得了 4.3k 颗 Star。开源地址：https://github.com/xai-org/grok-1...

生成式AI 2024-04-01 人工智能

945阅读

GPT-4单项仅得7.1分，揭露大模型代码能力三大短板，最新基准测试来了

首个AI软件工程师Devin正式亮相，立即引爆了整个技术界。 Devin不仅能够轻松解决编码任务，更可以自主完成软件开发的整个周期——从项目规划到部署，涵盖但不限于构建网站、自主寻找并修复 BUG、训练以及微调AI模型等。这种 “强到逆天” 的软件开发...

大数据 2024-04-01 人工智能

956阅读

AI明星创业公司买英伟达GPU ，几周估值翻倍，但花的钱比赚的多17倍

在AI行业，尤其是生成式AI领域，技术的快速发展和应用的广泛前景吸引了大量的投资和关注。然而，这一领域的高昂成本也引起了业界的广泛讨论。最近，《华尔街日报》的一篇报道指出，AI行业的公司在购买英伟达GPU上的投入是其收入的17倍，这一数字令人震惊，同时也引...

AIGC 2024-04-01 人工智能

856阅读

大语言模型中常用的旋转位置编码RoPE详解：为什么它比绝对或相对位置编码更好?

自 2017 年发表“ Attention Is All You Need ”论文以来，Transformer 架构一直是自然语言处理 (NLP 领域的基石。它的设计多年来基本没有变化，随着旋转位置编码 (RoPE 的引入，2022年标志着该领域的...

AIGC 2024-04-01 人工智能

968阅读

Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型

近期，中国香港中文大学和 SmartMore 的研究人员推出了一种名为 Mini-Gemini 的新颖框架，通过增强多模态输入处理来推动 VLMs 的发展。Mini-Gemini 采用了双编码器系统和一种新颖的补丁信息挖掘技术，结合一个特别策划的高质量数据...

大数据 2024-04-01 人工智能

838阅读

探索LLaMA模型：架构创新与Transformer模型的进化之路

引言在人工智能和自然语言处理领域，预训练语言模型的发展一直在引领着前沿科技的进步。Meta AI（前身为Facebook）在2023年2月推出的LLaMA（Large Language Model Meta AI）模型引起了广泛关注。LLaMA模型以...

AIGC 2024-04-01 人工智能

1376阅读

比人类便宜20倍！谷歌DeepMind推出「超人」AI系统

AI的同行评审来了！一直以来，大语言模型胡说八道（幻觉）的问题最让人头疼，而近日，来自谷歌DeepMind的一项研究引发网友热议：大模型的幻觉问题，好像被终结了？论文地址：https://arxiv.org/pdf/2403.18802.pdf...

人工智能 2024-04-01 人工智能

775阅读

我的领导马斯克：痛恨开会，不要非技术中层，推崇裁员

马斯克称得上是个“魔鬼老板”这事儿，已经出了名了。现在，他的老部下卡帕西（Andrej Karpathy）又在最新访谈中“锤”了他一把（doge）：我不得不恳求他允许我招人。他（马斯克）总是默认要裁掉员工。喜欢裁人之外，在这场红杉组织的AI A...

生成式AI 2024-04-01 人工智能

772阅读

吴恩达：别光盯着GPT-5，用GPT-4做个智能体可能提前达到GPT-5的效果

AI 智能体是去年很火的一个话题，但是 AI 智能体到底有多大的潜力，很多人可能没有概念。最近，斯坦福大学教授吴恩达在演讲中提到，他们发现，基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然，基于 GPT-4 构建的智能体工...

AIGC 2024-04-01 人工智能

906阅读

微软、OpenAI又搞大动作：斥资1000亿美元开发AI超算「星际之门」

根据 Information 消息，微软和 OpenAI 正在计划一个数据中心项目，该项目将包含一个拥有数百万专用服务器芯片的超级计算机，以支持 OpenAI 的人工智能技术。另外，项目成本可能高达 1000 亿美元，包括一个名为 Stargate （「...

大数据 2024-04-01 人工智能

777阅读

【AIGC调研系列】Grok大模型与其他模型相比的优势和劣势

Grok大模型与其他模型相比，具有以下优势和劣势：优势：实时了解世界的能力：Grok能够通过X平台实时了解世界，这是其独特而根本的优势之一[2][6][17]。这意味着Grok能够在回答问题时提供最新的信息和数据。处理尖锐问题的能力：Gro...

大数据 2024-03-31 人工智能

2485阅读

3分钟学会写文心一言指令

码到三十五：个人主页心中有诗画，指尖舞代码，目光览世界，步履越千山，人间尽值得 ! 文心一言是百度研发的人工智能大语言模型产品，能够通过上一句话，预测生成下一段话。任何人都可以通过输入【指令】和文心一言进行对...

AIGC 2024-03-31 人工智能

1161阅读

AIGC｜Agentbot的构建实践

最近这几个月，智能体这一概念逐渐进入人们的视野并受到广泛讨论，各智能体和类智能体项目层出不穷。智能体不断被冠以“大模型下半场”，“软件2.0”等等称号，被认为是迈向通用人工智能的一大步，BabyGPT, AutoGPT等实验性产品相继出新。不满足于现在的聊...

人工智能 2024-03-30 人工智能

938阅读

AI写作的困惑与突破：深度探索其可能性与局限性

大家好，小发猫降重今天来聊聊AI写作的困惑与突破：深度探索其可能性与局限性，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI写作的困惑与突破：深度探索其可能性与局限性随着人工智能技术的飞...

生成式AI 2024-03-29 人工智能

915阅读

AI绘画Imagen大力出奇迹生成图像

AI绘画Imagen大力出奇迹生成图像介绍 Imagen是一个文本到图像的扩散模型，由Google大脑团队研究所开发。 Imagen通过创新的设计，摈弃了需要预训练视觉-语言模型的繁琐步骤，直接采用了T5等大规模语言模型作为文...

大数据 2024-03-29 人工智能

1007阅读

AI漫画自动生成器Al Comic Factory 支持批量生成不同语言的漫画

Al Comic Factory是一个独特的项目，它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术，它们共同工作，根据用户提供的简单文本提示，自动创建出包含人物对话和场景描述的漫画。项目地址:https:/...

人工智能 2024-03-29 人工智能

1102阅读

AI写作辅写疑似度查看方法：从困惑度到爆发度的探索

大家好，小发猫降重今天来聊聊AI写作辅写疑似度查看方法：从困惑度到爆发度的探索，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI写作辅写疑似度查看方法：从困惑度到爆发度的探索在AI写作的...

生成式AI 2024-03-29 人工智能

1315阅读

生成式AI为什么受到各行业追捧？

生成式AI是人类一种人工智能技术，可以生成各种类型的内容，包括文本、图像、音频和合成数据。那么什么是人工智能？人工智能和机器学习之间的区别是什么？人工智能是一门学科，是计算机科学的一个分支，研究智能代理的创建，这些智能代理是可以推理、学习和自主行动的...

人工智能 2024-03-29 人工智能

930阅读

如何开始定制你自己的大型语言模型

2023年的大型语言模型领域经历了许多快速的发展和创新，发展出了更大的模型规模并且获得了更好的性能，那么我们普通用户是否可以定制我们需要的大型语言模型呢？首先你需要有硬件的资源，对于硬件来说有2个路径可以选。高性能和低性能，这里的区别就是是功率，因为精...

AIGC 2024-03-29 人工智能

941阅读