-
Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言
1.摘要 我们提出了一个多模态框架Video-LLaMA1,它使大型语言模型(LLM 能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作,补充线性最小二乘法只处理视觉或听觉信号...
-
AI视野:Midjourney V6史诗级升级;ChatGPT新增存档聊天记录功能;阿里DreaMoving开源;百度千帆AppBuilder开放
???AI新鲜事 Midjourney V6史诗级升级,网友惊呼太逼真! 网友在Midjourney V6第二次社区评价中惊叹其逼真神图,光影效果出众,上线倒计时,可能在今明两天内发布。 ChatGPT新增存档聊天记录功能 12月21日,OpenAI在...
-
开发者笑疯了! LLaMa惊天泄露引爆ChatGPT平替狂潮,开源LLM领域变天
来源: 新智源 微信号:AI-era Meta的LLaMA模型开源,让文本大模型迎来了Stable Diffustion时刻。谁都没想 谁能想到,一次意外的LLaMA泄漏,竟点燃了开源LLM领域最大的创新火花。 一系列表现出色的Chat...
-
四分钟成功复现诺奖!CMU开发GPT-4化学家,自主编码操控机器人颠覆化学研究登Nature
ChatGPT大模型爆火这一年,没想到竟颠覆了整个化学领域。 先是谷歌DeepMind的AI工具GNoME成功预测出200万种晶体结构,随后微软推出的MatterGen,大大加速了设计所需材料特性的速度。 今天,CMU和Emerald Cloud Lab...
-
开源与闭源大模型之战:Llama 2 vs. GPT-4 vs. Claude-2
人工智能一直在以惊人的速度发展,特别是在自然语言处理(NLP)领域。这场革命的领跑者包括三种杰出的人工智能语言模型:Llama 2、GPT-4 和 Claude-2。在这篇博客中,我们将探索这些人工智能巨头,了解他们独特的能力以及他们对各个领域的潜在影响...
-
AIGC星辰大海:大模型工程师和产品专家深度训练营(第五期)即将开班
近屿智能OJAC第五期“AIGC星辰大海:大模型工程师和产品专家深度训练营”即将开班。 近屿智能OJAC秉承着“别人教你使用AIGC工具,例如ChatGP7和MJ,我们教您预训练和微调大模型以及开发软/硬件AI产品”的服务理念,已经帮助数千位学员成功...
-
开创全新通用3D大模型,VAST将3D生成带入「秒级」时代
生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。 传统3D 建模涉及游戏、影视、建筑等多个行业,普遍依赖专业人员手动操作,生产周期短则几天,多则以月为单位,单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...
-
together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资
目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic,而这两家公司最大的投资者分别是微软和亚马逊,他们投资的很大一部分不是资金,而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。 在闭源大模型之外,...
-
不到4分钟,这个GPT驱动的“化学家”能制造药物,还能复现诺奖研究!研究登Nature
你有没有想过,可能就在你阅读这篇文章的几分钟内,获得诺贝尔奖的化学反应就能被完美复刻出来。 是的,你没有听错,现在由AI驱动的系统已经能够自主了解这些化学反应,甚至设计出了实验室程序来制造它们。 人工智能在短短几分钟内就完成了这一切,并且一次尝试就...
-
研究:大模型在回答中会重复有害的错误信息
对大型语言模型的新研究表明,它们重复了阴谋论、有害的刻板印象和其他形式的错误信息。 在最近的一项研究中,滑铁卢大学的研究人员系统地测试了 ChatGPT 早期版本对六类陈述的理解:事实、阴谋、争议、误解、刻板印象和虚构。这是滑铁卢研究人员研究人机交互并探索...
-
11 位作家加入针对 OpenAI 和微软的诉讼
11位非虚构作家,包括普利策奖得主泰勒·布兰奇(Taylor Branch)、斯泰西·舍夫(Stacy Schiff 和凯·伯德(Kai Bird 等人,已加入了一起针对OpenAI和微软的侵权诉讼。 图源备注:图片由AI生成,图片授权服务商Midjou...
-
全面合作:传媒业巨头与OpenAI寻求共赢
12月13日,OpenAI与欧洲最大的数字出版公司施普林格Axel Springer宣布战略合作。这是继媒体联盟一再发起抵制AI厂商的抗议以来,首例传媒巨头与AI厂商从版权、技术及商业模式上的全方位战略合作。 本文梳理了此次合作带给新闻业的重要意义,与合作...
-
如何用ChatGPT把控应用程序生命周期
译者 | 朱先忠 审校 | 重楼 简介 在本文中,我们将从基础设施供应到配置管理和部署等各个环节来全方位探讨大型语言模型(LLM)是否适合应用于实际应用程序的生命周期开发。这项工作产生的源代码工程已经在GitHub上公开([参考资料11])。基础设施即代...
-
AIGC相关知识记录-1. 上手ChatGPT
AIGC系列文章目录 文章目录 AIGC系列文章目录 前言 一、半小时上手ChatGPT 二、行业黑话 1. LLM(大语言模型) 2. few-shot prompt(少样本提示) 3. temperature(温度) 三、运用...
-
ChatGPT、文心一言、New Bing介绍,以及如何选用。新时代,起风了
这里写自定义目录标题 ChatGPT 平台介绍 特点 New Bing 平台介绍 特点 文心一言 平台介绍 特点 总结 随着互联网、物联网技术的发展,人工智能在各行各业中的应用越来越广泛,同时也取得了突破性的进展。以微软小冰...
-
微软Azure发布GPT-RAG,为LLM部署提供超智能解决方案
微软Azure最近推出了GPT-RAG,这是一项超智能的解决方案,旨在让大型语言模型(LLMs)在企业中更加顺畅地运行。随着人工智能的不断发展,对LLMs的需求因其理解和生成类似人类文本的能力而迅速增长。然而,在企业中使这些工具正常运行并不容易。我们需要确...
-
研究发现,GPT 和其他 AI 模型无法分析 SEC 备案文件
一家名为 Patronus AI 的初创公司的研究人员发现,大型语言模型在分析美国证券交易委员会(SEC)备案文件时经常无法正确回答问题。即使是表现最佳的人工智能模型配置 OpenAI 的 GPT-4-Turbo,当给予几乎整个备案文件的阅读能力和相关问题...
-
ggerganov/llama.cpp 编译
ggerganov/llama.cpp - 编译出main可执行程序依赖以下的源代码文件 如果想在 Windows 系统编译出 llama.cpp 项目(这个是github上的仓库, ggerganov/llama.cpp ),需要在Visual St...
-
【EMNLP 2023】面向垂直领域的知识预训练语言模型
近日,阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性,发现在垂直领域的图谱结构具有全局稀疏,局部...
-
日本初创公司 Preferred Networks 设计自己的 AI 芯片,以克服瓶颈问题
日本初创公司 Preferred Networks 正在加大对定制人工智能芯片的投资,以确保在生成式人工智能的进步中获得关键硬件。 图源备注:图片由AI生成,图片授权服务商Midjourney 该公司的投资者包括丰田和发那科等大型企业。Preferred...
-
摸底谷歌Gemini:CMU全面测评,Gemini Pro不敌GPT 3.5 Turbo
前段时间,谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra(能力最强)、Pro 和 Nano。研究团队公布的测试结果显示,Ultra 版本在许多任务中优于 GPT4,而 Pro 版本与 GPT-3...
-
copilot 逆向
原文: copilot-explorer | Hacky repo to see what the Copilot extension sends to the server 对我来说,Github Copilot 极其有用。它经常能神奇地读懂我的...
-
前OpenAI首席科学家Ilya: 只要能够预测下一个token,人类就能达到AGI
近日,Nature将前OpenAI首席科学家Ilya Sutskever评为「2023年10大科学人物」。 这位刚刚因为OpenAI巨变而远离聚光灯的「AI技术灯塔」,似乎并没有做好准备回到公众视野之中。 Nature在介绍他的长文中说「Ilya拒绝了N...
-
你真的会写 Prompt ? 剖析 RAG 应用中的指代消解
随着 ChatGPT 等大语言模型(LLM 的不断发展,越来越多的研究人员开始关注语言模型的应用。 其中,检索增强生成(Retrieval-augmented generation,RAG)是一种针对知识密集型 NLP 任务的生成方法,它通过在生成过程中...
-
大语言模型训练数据常见的4种处理方法
本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》,作者: 码上开花_Lancer。 大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然,截止到2023 年9 月为止,还...
-
创业公司推出AI圣诞老人,孩子可与之进行逼真语音通话
如果人工智能真的来抢人类的工作,那么这个星期可能是个好时机,尤其是帮助地球上最忙碌的人的时候。 总部位于西雅图的创业公司Fixie,专注于帮助企业将大型语言模型融入其软件堆栈,推出了HiSanta.ai。这是一个网络体验,让人们可以与圣诞老人、鲁道夫、圣诞...
-
研究人员发现,谷歌Gemini表现不如GPT-3.5 Turbo
在近期的一项研究中,来自卡内基梅隆大学和BerriAI的研究团队对Google Gemini Pro进行了深入的评估,并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。这一发现无疑是对Google在生成式人工智能领域与OpenAI竞争的雄...
-
每个开发人员都应该知道的六个生成式AI框架和工具
译者 | 晶颜 审校 | 重楼 在快速发展的技术领域,生成式人工智能是一股革命性的力量,它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界,揭示了对每个开发人员都必不可少的框架和工具。 LangChain LangChain由H...
-
构建企业级大语言模型应用的秘诀:GitHub Copilot 的实践之路
GitHub Copilot 的开发团队分享了他们在构建能够同时为个人和企业用户带来价值的大语言模型(LLM)应用的心得体会。 本文经授权转载宝玉老师的个人博客(微博@宝玉xp),链接:https://baoyu.io/translatio...
-
MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT
MosaicML正在推出其第二个开源大型语言模型(LLM),称为MPT-30B,这是继五月份首次推出的较小的MPT-7B模型之后。 为了讨论新模型及其对开发人员的意义,我采访了MosaicML联合创始人兼首席执行官Naveen Rao。他之前的创业公司是...
-
ChatGPT的2023:开创人工智能的新纪元
12月16日,The Verge 根据获取的内部文件和 Lark(飞书)聊天记录报道称,字节跳动曾秘密使用 OpenAI 的模型输出文本来训练自己的大语言模型。即便中止使用 GPT 生成文本之后,代号为 Project...
-
正面刚ChatGPT,谷歌发布Bard! AI们要battle起来了?
面对ChatGPT的步步紧逼,谷歌终于做出了回应,选择了正面刚。 北京时间2月7日凌晨,谷歌CEO桑达尔·皮查伊(Sundar Pichai)宣布谷歌推出了下一代对话AI系统Bard。 消息一出,自然引起广泛讨论,ChatGPT的火爆程度有目共睹,...
-
word2vec作者爆料:seq2seq是我的想法、GloVe抄袭技巧,反击来了
随着 NeurIPS 2023 获奖论文的公布,十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Com...
-
研究团队开发开源大模型训练框架 Oobleck 提供快速且有保障的故障修复
随着对生成式人工智能技术需求的激增,大型语言模型的训练和容错性要求也在不断增加。为应对这一挑战,密歇根大学的研究人员开发了一款名为Oobleck的开源大型模型训练框架。该框架采用管道模板的概念,为大型模型的预训练提供了快速而可靠的故障恢复机制。 项目地址...
-
微软推出机器学习库GPT-RAG
随着人工智能的增长,大型语言模型(LLMs)因其解释和生成类似人类文本的能力而日益受欢迎。然而,将这些工具整合到企业环境中并确保可用性和维护治理是一项具有挑战性的任务。 为了解决这一难题,Microsoft Azure推出了GPT-RAG,这是一种专为使用...
-
如何在GenAI时代的网络军备竞赛中幸存
GenAI的迅速出现已经改变了网络安全的天平,促使各国政府采取行动,美国总统乔·拜登在10月份发布了一项全面的行政命令(EO 。 关于安全、有保障和值得信赖的AI开发和使用的行政命令就如何确保这项新兴技术的安全提供了指导——这是以前的订单所缺乏的,它还...
-
Gemini自曝文心一言牵出重大难题,全球陷入高质量数据荒?2024年或将枯竭
谷歌Gemini,又出丑闻了! 昨天上午,网友们激动地奔走相告:Gemini承认自己是用文心一言训练中文语料的。 国外大模型用中国模型产生的中文语料训练,这听起来就是个段子,结果段子竟然成现实了,简直魔幻。 微博大V「阑夕」夜亲自下场,在Poe网站上实...
-
BlueLM蓝心大模型测试体验入口 热门手机AI大模型推荐
BlueLM蓝心大模型是vivo AI全球研究院自主研发的大规模预训练语言模型,具有 70 亿模型参数量,能处理32K上下文长度。它基于260TB的多语言训练语料,提供了强大的语言理解能力,并可广泛应用于内容创作、知识问答、逻辑推理、代码生成等场景,持续为...
-
丹麦 AI 模型预测死亡率准确度超保险公司,引发被滥用担忧
12 月 19 日消息,丹麦科技大学的苏尼・莱曼・乔根森及其团队开发了一款强大的人工智能模型,可以根据个人数据预测死亡率,准确度远超现有的任何模型,甚至包括保险业使用的模型。研究人员表示,该模型能提前预警健康和社会问题,也需要警惕其被大型企业滥用。 乔...
-
Mistral AI CEO宣布于2024年开源GPT-4级别模型
法国初创公司Mistral AI的首席执行官Arthur Mensch在法国国家广播电台宣布,公司计划于2024年开源GPT-4级模型,引发了业界的关注。 最近,Mistral AI推出了基于MoE架构的8X7B模型,与GPT3.5和Llama270B等其...
-
大语言模型之四-LlaMA-2从模型到应用
最近开源大语言模型LlaMA-2火出圈,从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一,相比InstructGPT,LlaMA-2在数据质量、培训技术、能力...
-
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」,2人公司估值3400万刀
像Pika一样的神级创业故事又要再次上演了? 两位哈佛退学的年轻人,想要制造一款专用于大语言模型加速的AI加速器芯片,将于2024年第三季度交付,推理性能达H100的10倍。 在今年6月份,两位创始人Gavin Uberti和Chris Zhu创立了E...
-
UIUC清华联手发布全新代码大模型Magicoder 不到7B参数
在代码生成领域,UIUC和清华合作发布了Magicoder,这一全新的大型语言模型仅使用了7B参数,却能与顶级模型媲美,并以全面开源的方式分享了其代码、权重和数据。Magicoder的关键在于采用了OSS-INSTRUCT方法,该方法通过从开源代码中获取灵...
-
AI、零信任、边缘现代化与多云,2024这些技术趋势值得关注
事实上,在这场由ChatGPT激起的新一轮AI浪潮中,全球科技巨头、AI厂商、行业翘楚等纷纷下场,唯恐错过此番科技盛宴。同时,GenAI蓬勃发展产业规模也在高速增长,麦肯锡调查数据显示,2022年GenAI市场收入为400亿美元,预计2027年及203...
-
最新GPT-4.5疑似泄露!更强多模态,支持3D,价格飙6倍
大家对于 OpenAI产品的关注讨论热度,似乎从没下来过。最近,网上更是传得沸沸扬扬:最新版本的GPT-4. 5 好像神不知鬼不觉偷偷上线了! 根据Reddit网站OpenAI版块的爆料帖子, GPT-4. 5 被描述为“OpenAI 最先进的一款模型”,...
-
谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐
谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作,提出了一种名为PixelLLM的智能模型,旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发,尤其是婴儿描述其视觉环境的方式,包括手势、指向和命名。 Pix...
-
「X」Embedding in NLP|神经网络和语言模型 Embedding 向量入门
在「X」Embedding in NLP 进阶系列中,我们介绍了自然语言处理的基础知识——自然语言中的 Token、N-gram 和词袋语言模型。今天,我们将继续和大家一起“修炼”,深入探讨神经网络语言模型,特别是循环神经网络,并简要了解如何生成 Embe...
-
Hugging Face 首席执行官希望实现人工智能民主:将 AI 的力量集中在少数人手中是有风险的
Hugging Face 的首席执行官 Clément Delangue 对大型科技公司像商业专利一样保留机器学习代码的做法持反对态度。相反,他正在努力构建一个世界,在这个世界中,每个开发者或初创公司都可以自由访问人工智能模型,并有效地帮助 AI 实现开源...
-
用嘴写代码?继ChatGPT和NewBing之后,微软又开始整活了,Github Copilot X!
用嘴写代码?继ChatGPT和NewBing之后,微软又开始整活了,Github Copilot X! AI盛行的时代来临了,在这段时间,除了爆火的GPT3.5后,OpenAI发布了GPT4版本,同时微软也在Bing上开始加入了AI,也就是NewB...
-
程序员撑过ChatGPT一周年!不仅没被取代,还把AI用得贼6:10分钟开发一个应用
不知不觉间,距离掀起全球新一轮 AI 革命的 ChatGPT 出道,已经过去一周年了。在这场颠覆性的 AI 革命中,许多企业和程序员们逐渐形成了一个共识:“不会用 AI 就将被淘汰”。 为了避免“被淘汰”,这一年来众多企业和程序员全力拥抱 AI、开发各种...