-
全面突围,谷歌昨晚更新了一大波大模型产品
当地时间本周二,谷歌在 Google’s Cloud Next 2024 上发布了一系列 AI 相关的模型更新和产品,包括 Gemini 1.5 Pro 首次提供了本地音频(语音)理解功能、代码生成新模型 CodeGemma、首款自研 Arm 处理器 A...
-
AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 📰🤖📢AI新鲜事 OpenAI发...
-
万变不离AI!直击 Google Cloud Next 2024 大会更多细节,不只Gemini 1.5 Pro !
AI显然成了谷歌Cloud Next 2024的一条主线! 这一在拉斯维加斯举行的技术大会,自周二起持续至周四,谷歌宣布了大量新的以云为中心的产品和服务,涵盖从Gemin、平台、Workspace到网络安全工具等一切内容。 Google Cloud Ne...
-
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/...
-
Google Vids官网体验入口 谷歌视频编辑AI创作工具在线使用地址
Google Vids是一款强大的在线视频编辑器,集成了谷歌Gemini技术,为您提供AI驱动的视频创作解决方案。您可以使用它快速创建富媒体视频内容,适用于工作、项目演示、教学等多种场景。Google Vids支持全面的视频编辑功能,包括剪辑、转场特效、字...
-
基于数据正则化自博弈强化学习的人类兼容型自动驾驶
自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此,在模拟环境中,将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而,纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...
-
半年融资1.6亿美金,AI学语言又来敲Duolingo的门了
在11月的选题《卷起来了,网易和谷歌都想抢Duolingo的生意》中,我们观察到了谷歌和网易等公司都基于 AI 开发了语言学习产品,市面上也充斥着同类产品。但测试后发现,AI 在语言学习产品中的作用主要在“练口语”这个层面,解决“开口难”问题,相比于 Du...
-
阿里开源的32B大模型到底强在哪里?你知道吗?
阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢? 更高的性价比 Qwen1.5-32B中的B是billion的意思,也就是10亿,32B就代表320亿参数量。 阿里之前还开源过一个大模型Qwe...
-
尝试着在Stable Diffusion里边使用SadTalker进行数字人制作
首先需要标明的是,我这里是图片说话类型,而且是看了知识星球AI破局俱乐部大航海数字人手册进行操作的。写下这篇文章是防止我以后遗忘。 我使用的基础软件是Stable Diffusion,SadTalker是作为插件放进来的,需要注意的是这对自己的电脑GPU要...
-
在Vercel上一键部署Morphic 人人都能自建的问答式AI搜索
在AI技术飞速发展的今天,开源项目因其共享和协作的特性,成为了推动技术进步的重要力量。近日,一博主@indigo在其Vercel平台上成功部署了@miiura的AI搜索项目Morphic。 项目地址:https://github.com/miurla/m...
-
月之暗面真的很强?我们来用一个问题评测这些 ChatGPT 平替
号称平替甚至超越 ChatGPT 的产品层出不穷,今天就来做一个横向评测。本次评测的对象有: ChatGPT 3.5 ChatGPT 4 Google Gemini Anthropic Claude 3 Sonnet Perplexit...
-
1MB的神奇AI,检测百万文件,99%的准确率!
在 Web 开发中,上传文件至服务器前的文件类型检测至关重要。这一步骤不仅能够确保服务器和用户的安全,拦截可能的恶意文件,还能保证上传的文件完整且符合预期,提高数据的合规性。同时,通过及时给予用户反馈和指导,也能提升用户体验,避免不必要的困惑。 之前阿宝...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
消息称谷歌考虑对基于 AI 的搜索引擎收费,将部分功能添至高级订阅服务
4 月 4 日消息,据英国《金融时报》援引三位熟悉谷歌的知情人士消息称,谷歌考虑对基于人工智能的搜索收费,这对其商业模式来说是一次重大变化。因为自 2000 年以来,谷歌的搜索产品一直都是依靠广告盈利的。 据报道,谷歌正在考虑保持标准搜索(不含 AI...
-
GenAI如何改变企业对数据的处理方式
Anthropic 在 2024 年 3 月发布的 Claude 3 系列模型及其在众多基准测试中的成功表现对企业来说是个好消息,看起来企业客户将能够从更多供应商那里评估和选择更多高质量的AI和GenAI工具。 然而,随着公共工具和服务的质量和种类的...
-
(含代码)利用NVIDIA Triton加速Stable Diffusion XL推理速度
在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像 扩散模型正在改变跨行业的创意工作流程。 这些模型通过去噪扩散技术迭代地将随机噪声塑造成人工智能生成的艺术,从而基于简单的文本或图像输入生成令人惊叹的...
-
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谁能想到,我们多年前的聊天记录、社交媒体上的陈年照片,忽然变得价值连城,被大科技公司争相疯抢。 现在,硅谷大厂们已经纷纷出动,买下所有能...
-
OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频
AI 公司在获取高质量训练数据方面遇到的挑战,OpenAI 为了训练其最先进的大型语言模型 GPT-4,使用了超过一百万小时的 YouTube 视频副本。 据了解,该公司通过其 Whisper 音频转录模型转录这些视频,尽管这一做法在法律上具有争议性,Op...
-
斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4
近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。 这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。...
-
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。 近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社...
-
斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火
斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型,这款模型以其在端侧设备上的强大运行能力而受到广泛关注。 Octopusv2是一款拥有20亿参数的开源语言模型,专为在Android设备上运行而设计,同时也适用于汽车、个人电脑等其他...
-
whisper-large-v3:速度快的令人翻译模型三种实用的调用方法
1、whisper-large-v3 是openai公司的模型,可使用Python代码调用; 2、whisper-large-v3基础上chenxwh 制作了开源库insanely-fast-whisper ,可本地指令运行,或 Google Colab...
-
「有效上下文」提升20倍!DeepMind发布ReadAgent框架
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于Transformer的大语言模型(LLM)具有很强的语言理解能力,但LLM一次能够读取的文本量仍然受到极大限制。 除了上下文窗口...
-
爬虫原理及反爬虫技术
对于大数据行业,数据的价值不言而喻,在这个信息爆炸的年代,互联网上有太多的信息数据,对于中小微公司,合理利用爬虫爬取有价值的数据,是弥补自身先天数据短板的不二选择,本文主要从爬虫原理、架构、分类以及反爬虫技术来对爬虫技术进行了总结。 1、爬虫技术概述...
-
立省千元!Google Colab上的Stable Diffusion安装教程
写在前面 如果你是一名艺术家或设计师,你可能已经知道了如何使用AI进行创作。不过,对于那些刚刚开始接触AI创作的人来说,可能会对所需要的高性能计算机和昂贵的GPU感到困惑。 使用stable diffusion进行AI绘画创作需要占用大量的内存和计算资...
-
微软上线Copilot移动App,免费玩转ChatGPT全家桶
Microsoft Copilot移动端使用教程 Copilot正式发布安卓、iOS客户端,使用移动端的Copilot可无需登陆免费玩GPT-4v、GPT-4、DALL-4 三大模型,对于部分地区的用户而言,微软还推出了GPT-4 Turbo模型和第三方...
-
到2028年,AR和VR市场预计将达到2520亿美元
根据InsightPartners的一份报告,到2028年,全球AR和VR市场规模预计将达到2520亿美元,从2021年到2028年的复合年增长率(CAGR 将达到36.9%。该报告将市场增长归因于几个因素。 该报告按技术、组件、设备类...
-
python爬虫----了解爬虫(十一天)
🎈🎈作者主页: 喔的嘛呀🎈🎈 🎈🎈所属专栏:python爬虫学习🎈🎈 ✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心哦!✨✨ hello,小伙伴们!学习完前面的基础知识,今天我们就要进入爬虫世界了,你准备好了吗?那今天我们...
-
生成式人工智能格局:2024年及以后的趋势
生成式人工智能领域正在迅速扩张,尽管带来了巨大的挑战,但也带来了巨大的好处。 生成式人工智能是人工智能的一种形式,它依赖于自然语言处理、大规模训练数据集和先进的人工智能训练策略,如神经网络和深度学习,来生成类似于人类制作的原创内容。 技术专业人士和娱乐...
-
ChatGPT 与 Bard 评测,GPT 与 Gemini 谁的成果更好?
最近 AI 界的大新闻,莫过于 Google 的 Gemini 模型正式推出。 Google 在推出 Gemini 时,同时秀出了跑分,在 32 项跑分中,Gemini Ultra 有 30 项超越目前业界最强的 GPT-4,这引起了社群的广泛讨论。毕竟过...
-
马斯克推出Grok-1.5,接近GPT-4级别的性能
马斯克指出,Grok-1.5将为xAI在X平台上的ChatGPT挑战者聊天机器人提供支持,而Grok-2(新模型的继任者 仍在训练阶段。他表示,下一个版本应该能够“在所有指标上超越当前的AI”,但没有分享它可能何时变得可用的具体细节。 Grok-1....
-
DeepMind首发游戏AI智能体SIMA!只用自然语言就能玩转「山羊模拟器」
谷歌DeepMind在AI和游戏方面有着悠久的历史。 从过去与Atari游戏的密切合作开始,然后发展到AlphaStar系统可以在《星际争霸II》中达到人类大师级水平,到如今,DeepMind从单个游戏转向了通用的、可指导的游戏AI代理。 SIMA,是一...
-
爆火的Ai绘画到底怎么用?Disco Diffusion(免费)入门
前段时间,一幅用AI绘制的作品获得绘画大奖的新闻又一次让AI绘画的话题热了起来,作为有一定美术基础的我看来,仅仅通过修改一些参数,通过文字描述,就可以获得一幅超过许多专业人士的画作,的确是让大部分公众兴奋,让少部分专业人士担忧的事。 不过,关于未来画家会...
-
52个AIGC视频生成算法模型介绍
基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。 AIGC视频算法发展现状 从2023年开始,AIG...
-
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in la...
-
知乎AI革命:智能搜索与实时问答的融合
在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未来,有三个基本的视角: 它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用Kimi Chat,就以知乎为重要的训练资料来源(甚至是80%以上的...
-
RAG 修炼手册|RAG 敲响丧钟?大模型长上下文是否意味着向量检索不再重要
Gemini 发布后,由于其在处理长上下文方面表现出色,行业不乏“RAG 已死”的声音。RAG 到底有没有被杀死?向量数据库的还是 AI 应用开发者的最佳拍档吗?本文将一起探讨。 01.Gemini 发布后 AIGC 的迭代速度正以指数级的速度增长。G...
-
一文尽览!相机内参标定的工具有哪些?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 相机标定任务是很多高级功能的上游,无论是深度学习方案或是传统方案都非常依赖相机标定精度,今天就为大家盘点下相机内参标定常用的工具箱。 1)OpenCV标定工具箱 opencv这个不用多说了,支持多种相机...
-
Stable Diffusion 3 来了 —— 充满了巨大的改进
文章目录 什么是Stable Diffusion 3? Stable Diffusion 3 有哪些新功能? Stable Diffusion 3 对比 Dall-E 3 和 Gemini 如何获得Stable Diffusion 3 的访问权...
-
【wails】(8):发现一个用golang重写llama.cpp的llama.go项目,经测试支持f32模型,半年未更新,找到llama.cpp对应的版本,可以转换f32模型
1,项目地址 https://github.com/gotzmann/llama.go 项目最后的发布时间是2023年4月28日 项目是把 llama.cpp 的项目重写使用 golang 重写了下。 https://www.bilibili.co...
-
LLM大模型之基于SentencePiece扩充LLaMa中文词表实践
LLM大模型之基于SentencePiece扩充LLaMa中文词表实践 目前大模型的词表和分词器都是基于SentencePiece工具实现的,比如LLaMa,BLOOM,ChatGLM,Baichuan等,简单来说SentencePiece就是工程化的...
-
聊聊国内如何使用ChatGPT的堂兄弟Copilot
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 发布在https://it.weoknow.com 01,序言 ...
-
OpenAI公关跳起来捂他嘴:Transformer作者公开承认参与Q*!|八位作者最新专访
Q* Transformer作者中唯一去了OpenAI的那位,公开承认了: 他参与了Q*项目,是这项新技术的发明者之一。 这几天除了英伟达老黄组局把Transformer作者聚齐,他们中的几位还接受了连线杂志的采访,期间出了这么一个小插曲。 当记者试图询问...
-
如何利用对抗学习实现产品推荐功能?
作者 | 汪昊 审校 | 重楼 推荐系统自1992 年首篇论文提出协同过滤算法诞生以来,经历了互联网公司百万次的模型迭代,犹如不断涅的凤凰,从一次又一次的低谷中不断重生,先后诞生了百分点、快手、抖音、今日头条等知名的公司和产品。 推荐系统最大的功能在于...
-
2024 CSRankings全美计算机科学排名发布!CMU霸榜,MIT跌出前5
2024 CSRankings全美计算机科学专业排名,刚刚发布了! 今年,全美全美CS最佳大学排名中, 卡耐基梅隆大学(CMU)位列全美第一,同时是CS世界第一。与此同时,伊利诺伊大学香槟分校(UIUC),连续6年稳居榜单第二。佐治亚理工学院位列第三。...
-
能玩3D游戏的AI玩家!谷歌新智能体SIMA发布,但水平还在“新手村”
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 世界上第一位AI程序员Devin诞生,让大家纷纷转发感叹“饭碗保不住”。 一转眼,具有里程碑意义的AI玩家也来了!谷歌(Google)旗下DeepMind发布新智能体SIMA。 S...
-
16款Stable Diffusion插件推荐,让SD小白快速上手
随着 Stable Diffusion 的不断进化,越来越多的开发者加入到插件开发的行列中。大家都知道网上虽然教程多,但非常碎片,一个个学习和查阅真的非常耗时,感觉每天都在烧脑。如果你是SD小白或者是小懒猫,又想快速上手使用 Stable Diffusio...
-
Stable diffusion,AI绘画入门,秋叶大佬整合包(附网盘链接)
第一篇:SD安装和显卡要求 最近一段时间,AI绘画很火热,是不是感到对AI绘画很好奇,那么接下来介绍一下如何安装部署。让读者也能快速上手。进入AI绘画的世界。 最简单最容易入手的便是直接使用秋叶大佬的整合包,链接如下: 我用夸克网盘分享了「sd-we...
-
一图揽尽全球LLM崛起之路;LLM概念速查清单;DALL·E提示词红宝书·在线版;fast.ai新课带你从零实现Stable Diffusion | ShowM
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 👀 LLM 崛起之路:全球大语言模型「规模增长」可视化交互图 informationisbeautiful.net/visualizati…...
-
Transformer七子重聚GTC,老黄亲自赠送签名版DGX-1!7年奠基之作背后佚事揭秘
GTC大会上,老黄与Transformer八位作者一场最新访谈,简直火爆了! 演讲前一个半小时,现场门外就挤满了人。许多人早早排起了长队,期待着这场别致的访谈。 就连老黄也提前到场,在人群中合影。 老黄主旨演讲当天,现场虚无坐席,网友戏称他为AI届的...