-
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
一个可以自动分析PDF、网页、海报、Excel图表内容的大模型,对于打工人来说简直不要太方便。 上海AI Lab,香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(简写为IXC2-4KHD)模型让这成为了现实。 相比于其他多模...
-
CIO并不完全看好人工智能Copilot
近几个月来,一种新型的人工智能助手将目光投向了企业用户,Microsoft 和其他厂商承诺将为企业用户带来巨大的生产力提升,从而抵消成本。 但 Microsoft 在价值主张方面仍有许多工作要做。Microsoft 365 的 Copilot 是越来越多...
-
谷歌整合 AI 重心,DeepMind 和研究团队合并
谷歌在周四宣布将整合旗下专注于构建人工智能(AI)模型的两个内部团队。 Alphabet 和谷歌 CEO 桑达尔・皮查伊在公司网站上发布了一篇博客文章,解释了将 AI 模型构建团队整合到谷歌 DeepMind 团队内的决定,其中包括来自公司研究部门的团队。...
-
小即是大?HuggingFace CEO预测小模型元年将至,将成为AI的下一个“大事件”
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能领域的竞争中,科技巨头们一直在竞相构建越来越大的语言模型。Scaling Law 信仰随着模型规模的增加,其性能会指数提升,展现出更好的泛化能力,甚至在某些情况下展现出“...
-
Llama3突然来袭!开源社区再次沸腾:GPT4级模型自由访问时代到来
Llama 3来了! 就在刚刚,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。 并且推出即为开源SOTA: Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。 8B模型在MMLU、GPQA、Huma...
-
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
LLM界的「真·Open AI」,又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了? 一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜。 这...
-
Meta 发布Llama 3,能力直逼GPT-4,一己之力拉高开源大模型水位
编辑|伊风、诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Meta麾下“羊驼”一路狂奔在开源的大道上。 在过去的一年里,Llama系列可以说开辟了开源LLM的半壁江山。 嫌弃开源模型能力只有GPT-3.5,不够用? 如今Llam...
-
Next ’24 - 踏上云端新旅程
作者 | Google Cloud CEO, Thomas Kurian 去年,全世界才开始想象生成式 AI 将为企业带来怎样的转变,如今这些转变正在逐步展开。 而 Google 一直遵循着相同的原则:打造人人都能受益的 AI 技术,尽力为更多人带来更...
-
谷歌AI落后了 问题到底出在哪?
2023年年初,谷歌匆匆出兵,奋力开发AI模型,应对ChatGPT带来的压力。随后几个月里,谷歌加码测试生成式AI,内部出现几套模型,希望通过内部赛马拿出有竞争力的成果。 可惜,模型虽多,但没有一个可以与OpenAI CPT-4抗衡。无奈之下,谷歌只得...
-
谷歌推出 AI 创作应用 Google Vids:会 PPT 就能做视频、支持多人协作
4 月 10 日消息,过去传统办公一直围绕着文档、电子表格和幻灯片(如微软的 Word、Excel、PowerPoint,苹果的 Pages、Numbers、Keynote,谷歌的 Docs、Sheets、Slides)。现在,谷歌想要增加一个名为...
-
谷歌向微软英特尔全面宣战:首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨晚的Google Cloud Next2024大会上,谷歌接连放出一堆模型和产品王炸:Gemini1.5Pro公开可用、上线音频处理能力;代码模型CodeGemma上新,首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次,谷歌要以量取胜。 昨天...
-
全面突围,谷歌昨晚更新了一大波大模型产品
当地时间本周二,谷歌在 Google’s Cloud Next 2024 上发布了一系列 AI 相关的模型更新和产品,包括 Gemini 1.5 Pro 首次提供了本地音频(语音)理解功能、代码生成新模型 CodeGemma、首款自研 Arm 处理器 A...
-
AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 OpenAI发...
-
万变不离AI!直击 Google Cloud Next 2024 大会更多细节,不只Gemini 1.5 Pro !
AI显然成了谷歌Cloud Next 2024的一条主线! 这一在拉斯维加斯举行的技术大会,自周二起持续至周四,谷歌宣布了大量新的以云为中心的产品和服务,涵盖从Gemin、平台、Workspace到网络安全工具等一切内容。 Google Cloud Ne...
-
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/...
-
GPT-5:我们期待看到的4个新功能
尽管我们不知道GPT-5何时发布,但是我们依然可以期待一下GPT-5的新功能。 OpenAI的GPT-4目前是市场上最好的生成式AI工具,但这并不意味着我们不展望未来。随着OpenAI首席执行官Sam Altman定期暗示GPT-5的信息,似乎我们不久将...
-
在Vercel上一键部署Morphic 人人都能自建的问答式AI搜索
在AI技术飞速发展的今天,开源项目因其共享和协作的特性,成为了推动技术进步的重要力量。近日,一博主@indigo在其Vercel平台上成功部署了@miiura的AI搜索项目Morphic。 项目地址:https://github.com/miurla/m...
-
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了! 外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。 前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算力难题。 然而,数据也是训练下一代强大模型,最重要的一味丹...
-
CS25官网体验入口 斯坦福大学深度学习AI课程免费在线使用地址
CS25是斯坦福大学提供的一门课程,主要探讨深度学习模型Transformers,该模型在全球范围内产生了巨大影响。课程邀请了Transformers研究领域的前沿人物,讨论从GPT和Gemini等LLM架构到创造性应用(如DALL-E和Sora)在内的最...
-
月之暗面真的很强?我们来用一个问题评测这些 ChatGPT 平替
号称平替甚至超越 ChatGPT 的产品层出不穷,今天就来做一个横向评测。本次评测的对象有: ChatGPT 3.5 ChatGPT 4 Google Gemini Anthropic Claude 3 Sonnet Perplexit...
-
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在人工智能构筑的世界中,AI 有时会像人一样存在着某种偏见或倾向性。比如对于大语言模型而言,由于训练数据的影响会不可避免地存在性别偏见...
-
消息称谷歌考虑对基于 AI 的搜索引擎收费,将部分功能添至高级订阅服务
4 月 4 日消息,据英国《金融时报》援引三位熟悉谷歌的知情人士消息称,谷歌考虑对基于人工智能的搜索收费,这对其商业模式来说是一次重大变化。因为自 2000 年以来,谷歌的搜索产品一直都是依靠广告盈利的。 据报道,谷歌正在考虑保持标准搜索(不含 AI...
-
中科大等意外发现:大模型不看图也能正确回答视觉问题!
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。 他们首先看到像...
-
首个开源世界模型LWM :百万级上下文,长视频理解超GPT-4
来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型,被称为 LWM(LargeWorldModel)系列模型。这一模型采用了大量视频和书籍数据集,通过 RingAttention 技术实现了长序列的可扩展训练,使得模型的上下文长度达到了1M to...
-
用免费GPU部署自己的stable-diffusion项目(AI生成图片)
2021年时出现了 openAI 的 DALL,但是不开源。2022年一开年,DALL-E 2发布,依然不开源。同年7月,Google 公布其 Text-to-Image 模型 Imagen,并且几乎在同一时间段AI图像生成平台 Midjourney 也进...
-
谷歌在Pixel 8上禁用自家大模型!会占用大量手机内存
快科技4月3日消息,据媒体报道,最近,谷歌因为硬件限制”问题,禁止在Pixel 8手机上运行其最新的人工智能模型Gemini Nano。 据谷歌设备和服务软件副总裁Seang Chau解释,Gemini Nano的一些AI模型需要常驻内存以随时调用。然而,...
-
谷歌挖走OpenAI的大将!前开发者关系负责人官宣加盟
整整一个月,OpenAI前开发者关系负责人Logan Kilpatrick正式官宣加入谷歌。 他将负责AI Studio产品,并为Gemini API提供支持。 Logan表示,未来还有很多工作要做,让谷歌成为开发人员使用AI进行开发的最佳场所。 L...
-
现在,ChatGPT不注册登录也能免费用了
现在,使用 OpenAI 的人工智能平台 ChatGPT,不需要注册账户了。 当地时间 4 月 1 日,OpenAI 正式公布了这个新政策,立即引来了全网的欢呼。 在开放之后,ChatGPT 打开就能用,看起来终于初步具备了「AI 搜索引擎」的样...
-
今日AI:ChatGPT免注册可使用;开发者没法“白嫖”Gemini了;AI程序员首次入职科技公司;DALL·E聊天就能改图了
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 今天起,Cha...
-
黄学东分享:Zoom AI如何正确地「碾压GPT-4」
去年底,从微软离职加入Zoom的华人AI大佬黄学东以Zoom CTO的身份发表了一篇技术博客,介绍了Zoom推出的联邦AI技术—— 差异化地利用不同成本的AI工具,让能力强成本高的AI完成难度大的任务;成本低能力弱的AI完成简单的任务,从而在完成质量和G...
-
ChatGPT 与 Bard 评测,GPT 与 Gemini 谁的成果更好?
最近 AI 界的大新闻,莫过于 Google 的 Gemini 模型正式推出。 Google 在推出 Gemini 时,同时秀出了跑分,在 32 项跑分中,Gemini Ultra 有 30 项超越目前业界最强的 GPT-4,这引起了社群的广泛讨论。毕竟过...
-
马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4
就在刚刚,马斯克Grok大模型宣布重大升级。 难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。 来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大” 图片 新版本Grok有啥突破? 一是上下文长度飙升,从8192...
-
苹果似乎达到了AGI,此AGI非彼AGI
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 近日,苹果宣布,全球开发者大会(WWDC)将于6月10日(北京时间6月11日)开幕,大会面向所有开发者全程在线开放。 据官方新闻稿介绍,本次活动“旨在展示 iOS、iPadOS、m...
-
今日AI:AI视频神器PixVerse被玩出花;抖音封杀李一舟等“割韭菜”内容;最神秘国产大模型团队冒泡;剪映Dreamina一键整合mj+sd+PS工作流
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 AI视频生成神器...
-
马斯克推出Grok-1.5,接近GPT-4级别的性能
马斯克指出,Grok-1.5将为xAI在X平台上的ChatGPT挑战者聊天机器人提供支持,而Grok-2(新模型的继任者 仍在训练阶段。他表示,下一个版本应该能够“在所有指标上超越当前的AI”,但没有分享它可能何时变得可用的具体细节。 Grok-1....
-
Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型
近期,中国香港中文大学和 SmartMore 的研究人员推出了一种名为 Mini-Gemini 的新颖框架,通过增强多模态输入处理来推动 VLMs 的发展。Mini-Gemini 采用了双编码器系统和一种新颖的补丁信息挖掘技术,结合一个特别策划的高质量数据...
-
新AI工具DrugGPT:或可帮助英国医生开具处方药
药物是医学的基石,但有时医生在开具处方时会犯错,患者也可能没有正确地服用药物。牛津大学开发的新型 AI 工具 DrugGPT 旨在解决这两个问题。DrugGPT 为临床医生在开具药物处方时提供了一个安全网,同时也为他们提供了有助于患者更好理解药物用途和服用...
-
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统
AI的同行评审来了! 一直以来,大语言模型胡说八道(幻觉)的问题最让人头疼,而近日,来自谷歌DeepMind的一项研究引发网友热议: 大模型的幻觉问题,好像被终结了? 论文地址:https://arxiv.org/pdf/2403.18802.pdf...
-
吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果
AI 智能体是去年很火的一个话题,但是 AI 智能体到底有多大的潜力,很多人可能没有概念。 最近,斯坦福大学教授吴恩达在演讲中提到,他们发现,基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然,基于 GPT-4 构建的智能体工...
-
Midjourney国内免费试用,完美解决AI绘画的三大痛点
Midjourney 可谓是最炙手可热的 AI 绘画神器!只要你提供几句提示词,短短的一分钟之内,神奇的 AI 立马就能给你呈现出媲美专业设计师花费数日才能创作出的精美艺术作品! 甚至不止限于绘画,它还具备制作海报、LOGO 以及进行网站设计和 UI 设...
-
总计40亿美元!亚马逊向AI创企Anthropic再投资
3月29日消息,亚马逊正进行其成立30年以来最大的一笔外部投资,旨在人工智能领域抢占先机。 据悉,亚马逊计划再次对位于旧金山的人工智能初创企业Anthropic进行27.5亿美元的投资。Anthropic是生成式人工智能领域的佼佼者,其核心模型和聊天机...
-
密传!苹果牵手Anthropic,加码iOS 18,挑战ChatGPT!
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 苹果公司被广泛传言正在与多家人工智能公司进行接洽,其中包括OpenAI、谷歌以及谷歌支持的创业公司Anthropic,旨在为预计今年晚些时候推出的iOS 18提供一系列全新AI特性支撑...
-
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...
-
马斯克突然发布Grok 1.5!上下文长度飙升16倍和GPT-4齐平
快科技3月29日消息,就在刚刚,埃隆马斯克旗下的人工智能初创公司xAI宣布正式推出Grok-1.5,官方推送啥也没说,直接甩链接,主打一个字少事大”。 Grok-1.5有哪些升级呢,主要是两个方面: 1、长上下文理解 对于上下文窗口,Grok-1.5直接提...
-
如果谷歌与苹果达成AI合作 微软与OpenAI的联盟会不会地位难保?
因为在AI上掌握先发优势,微软老树开新花,成为科技界当红明星。它的市值已经达到3.2万亿美元,是全球市值最高的企业。 微软之所以如此耀眼,主要还是归功于OpenAI。目前OpenAI开发的GPT大语言模型已经是微软Copilot的基础。最近微软正在以光...
-
和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异
3 月 28 日消息,根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。 IT之家首先介绍下 LMSYS Org,该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内...
-
RAG 修炼手册|RAG 敲响丧钟?大模型长上下文是否意味着向量检索不再重要
Gemini 发布后,由于其在处理长上下文方面表现出色,行业不乏“RAG 已死”的声音。RAG 到底有没有被杀死?向量数据库的还是 AI 应用开发者的最佳拍档吗?本文将一起探讨。 01.Gemini 发布后 AIGC 的迭代速度正以指数级的速度增长。G...
-
钉钉AI:好险,差点就被长文本卷到
好家伙,现在随便打开一个大模型应用,支持的文本都有那————么长。 最新消息,7亿人在用的钉钉也加入战局,一出手就是长文本、多模态和工作流三大能力升级,全是最热门的AI迭代方向。 专门提一下,钉钉AI助理的长文本这次能轻松拿捏几十万字的文档,甚至放话单文档...
-
号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,语言理解、编程能力等均超 GPT-3.5
3 月 28 日消息,初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 DBRX 采用 transformer 架构,包含 1320...
-
Stable Diffusion 3 来了 —— 充满了巨大的改进
文章目录 什么是Stable Diffusion 3? Stable Diffusion 3 有哪些新功能? Stable Diffusion 3 对比 Dall-E 3 和 Gemini 如何获得Stable Diffusion 3 的访问权...