-
微软首次推出27亿参数的Phi-2模型,性能超过许多大型语言模型
微软发布了一款名为Phi-2的人工智能模型,该模型表现出了不凡的能力,其性能可媲美甚至超越规模是其25倍的、更大、更成熟的模型。 微软在近日的一篇博文中宣布,Phi-2是一个拥有27亿参数的语言模型,与其他基础模型相比,它在复杂的基准测试中表现出了 "先...
-
【Video-LLaMA】增强LLM对视频内容的理解
Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...
-
Bard AI:训练过程中使用了多少数据?
近年来,人工智能取得了长足的进步,并在科技界掀起了波澜。 随着谷歌最近推出新的人工智能聊天机器人 Bard,人们对这项技术的工作原理以及训练它的内容感到好奇。 人工智能技术的关键组成部分之一是训练过程中使用的数据量,这有助于它更好地理解语言、...
-
外包数据注释服务如何增强人工智能模型?
在人工智能(AI 和机器学习(ML 领域,基础在于数据,数据的质量、准确性和深度直接影响人工智能系统的学习和决策能力。数据有助于丰富机器学习算法数据集的数据注释服务,对于教导AI系统识别模式、做出预测和提高整体性能至关重要。 通过高质量数据注释为ML模...
-
文心一言与通义千问有什么区别
文心一言和通义千问是当前人工智能领域中广泛应用的两个自然语言处理技术。它们能够理解、生成和转换语言,使得我们更加轻松地与计算机进行交互。在这篇文章中,我们将会对比分析百度AI语言模型文心一言和阿里AI语言模型通义千问语言模型的特点。 首先,从名称...
-
【多模态】5、BLIP | 统一理解与生成任务 为图像生成更高质量的文本描述
文章目录 一、背景 二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...
-
Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源
Stability AI以其stable diffusion文本到图像的生成人工智能模型而闻名,但这已不再是该公司的全部业务。 最新发布的StableLM Zephyr3B是一款30亿参数的大语言模型,专为聊天应用场景进行了优化,包括文本生成、摘要和内容个...
-
从零开始训练 Stable Diffusion 的成本 < 16 万美元
我们想知道使用我们的流数据集、Composer 和 MosaicML 云平台从头开始训练稳定扩散模型需要多少时间(和金钱)。我们的结果:13 天内我们将花费 79,000 个 A100 小时,总培训成本不到 160,000 美元。我们的工具不仅将时间和成本...
-
Meta语音达LLaMA级里程碑!开源MMS模型可识别1100+语言
【新智元导读】Meta的大规模多语言语音 (MMS) 项目将彻底改变语音技术,使用wav2vec 2.0的自监督学习,MMS将语音技术扩展到1100到4000种语言。 在语音方面,Meta又达到了另一个LLaMA级的里程碑。 今天,Me...
-
戴尔CTO预测量子计算和生成式AI将在未来五年内实现交汇
在最新的一次在线圆桌会议中,戴尔技术的全球首席技术官约翰·罗斯表示,人工智能将推动其他新兴技术在先进硬件、边缘设备和网络安全领域协同发展,从而促进业务转型。他强调,量子计算和生成式人工智能将在未来五年内实现交汇,成为创新的驱动力。 罗斯指出,在2024年...
-
DetZero:Waymo 3D检测榜单第一,媲美人工标注!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 本文提出了一套离线3D物体检测算法框架DetZero,通过在 Waymo 公开数据集上进行全面的研究和评估,DetZero可生成连续且完整的物体轨迹序列,并充分利用长时序点云特征显着提升感知结果的质...
-
AIGC系列:1.chatgpt可以用来做哪些事情?
上图的意思:神器轩辕剑 那么,在现在AI盛行的信息时代, 你是否知道如何获得和利用ChatGPT这一把轩辕剑来提升你的攻击力和生存能力呢? 故事 程序员小张: 刚毕业,参加工作1年左右,日常工作是CRUD 架构师老李: 多个大型项目经验...
-
人工智能大战:亚马逊 AWS 重磅投入生成式 AI 向微软和谷歌发起挑战
亚马逊的 AWS re:Invent 开发者大会本周拉开帷幕,一系列重磅公告显示出亚马逊正在努力迎头赶上 AI 领域的佼佼者和主要竞争对手微软。 作为亚马逊至关重要的亚马逊网络服务(AWS)业务的年度展示窗口,今年的会议重点放在了生成式 AI 上,力图抗...
-
Stable Diffusion的使用以及各种资源
Stable Diffsuion资源目录 SD简述 sd安装 模型下载 关键词,描述语句 插件管理 controlNet 自己训练模型 SD简述 Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要...
-
人工智能十大基础术语
这里有10个关键的术语,每个人工智能爱好者都应该知道并了解。 人工智能(AI 已经成为各行各业的变革力量,塑造了我们与技术和周围世界互动的方式。对于那些深入人工智能领域的人而言,理解基础术语至关重要。 1、人工智能(AI :人工智能的核心是指开发能够执...
-
【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型
文章目录 一、背景 二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择 三、效果 四、思考 论文:Learning Transferabl...
-
大...大义灭亲?谷歌AI判定:美国登月照系伪造
1969年阿波罗11号成功登陆月球,阿姆斯特朗说出了那句至今让无数人记忆犹新的话“这是我个人的一小步,却是全人类的一大步”。 现在,故事出现了反转….. 在俄罗斯的一个科技展上,美国谷歌的人工智能通过神经网络对美国登月照片进行了大量分析,包括光的明暗对比...
-
疑似威胁人类?OpenAI神秘Q*项目更多信息曝光,马斯克、Lecun下场争论…
夕小瑶科技说 原创 作者 | 王二狗大家好我是二狗 随着前天 OpenAI 官宣 Sam Altman 将回归,并继续担 CEO,OpenAI“宫斗事件”已经告一段落了。 然而,对于专业吃瓜的二狗来说,有一个核心问题还是没有搞明白: Sam Altman...
-
浅谈人工智能中的算力、算法和数据
Labs 导读 随着科技的飞速发展,人工智能(Artificial Intelligence,AI)已经成为当今最热门的话题之一。在人工智能的应用中,算力、算法和数据是三个不可或缺的要素,也是生成式人工智能(AIGC)发展的核心。通过对人工智能中算...
-
【网安AIGC专题11.1】11 Coreset-C 主动学习:特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)
Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面 论文名片 先验知识的补充 主动学习 采样函数 benchmark基准和base...
-
手把手教你使用stable diffusion生成自己的艺术二维码
艺术二维码制作指南 导读 midjourney stable diffusion 环境准备安装 stable diffusion webui sd-webui-qrcode-toolkit 安装 草料二维码 模型准备 QR Patter...
-
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索
OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波! 路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索: 内部名为Q (发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。 Q*正是由这场风暴的中...
-
Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型
内容来源:@xiaohuggg Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型 该模型是由Hugging Face团队开发,它在Whisper核心功能的基础上进行了优化和简化,体积缩小了50%。速度提高了6倍。并...
-
从数据到诊断:谈青光眼的深度学习方法检测
青光眼是造成全球无数民众罹患不可逆失明的重要致残因素。青光眼本身只是统称,指代一系列对眼部与大脑视神经之间的连接造成损害的眼部疾病,严重时可导致视力丧失。根据布莱恩霍尔顿视觉研究所对全球失明及远视障碍原因的系统回顾与深入分析,青光眼已经成为全球第二大致...
-
Grounding dino + segment anything + stable diffusion 实现图片编辑
目录 总体介绍 总体流程 模块介绍 目标检测: grounding dino 目标分割:Segment Anything Model (SAM 整体思路 模型结构: 数据引擎 图片绘制 集成 样例 其他问题 附录 总体介绍...
-
使用代码下载开源的大模型文件示例以及中文微调llama资源汇总:
一、下载示例 from huggingface_hub import snapshot_download repo_id = "THUDM/chatglm2-6b" local_dir = './chatglm2-6b/' cache_dir = l...
-
[stable-diffusion-art] 指北-4 模型
Beginner's guide to Stable Diffusion models and the ones you should know - Stable Diffusion ArtHow to install, use and merge sta...
-
ChatGPT应用在AIGC内容生产【赠书活动|第一期《硅基物语》】
文章目录 爆火的AI工具ChatGPT 走入大众视野的AIGC AIGC领域的发展 AIGC价值引领 『赠书活动 | 第一期』 本期中奖者 爆火的AI工具ChatGPT 2023年伊始,ChatGPT就火遍全网,成为了全球最快拥有...
-
Google Bard VS ChatGPT:哪个是更好的AI聊天机器人?
文章目录 前言 一、Bard和ChatGPT的宏观对比 二、应用场景不同 三、知识的时效性 四、未来的归宿 总结 前言 自从 OpenAI 向公众发布ChatGPT以来的过去几个月里,我们都见证了围绕 ChatGPT 的各种测评...
-
浅析半监督学习及其应用场景
Labs 导读 随着互联网的发展,企业可以获得越来越多的数据,这些数据可以用于帮助企业更好的了解用户,即客户画像,也可以用来改善用户的体验。但这些数据中可能存在大量没有标记的数据。如果所有数据均采用人工标记的方式则存在两方面的缺点,一是花费的时间成本较...
-
Meta工程师称全球AI推理用电仅需新增两座核电站即可满足
近日,Meta公司的生成式人工智能工程总监谢尔盖·埃杜诺夫在硅谷数字工人论坛上透露,为满足明年全球不断增长的人工智能应用推理需求,仅需新增两座核电站的发电量即可。 埃杜诺夫表示,他仅通过简单的数学计算得出这个结果。他专门分析了人工智能“推理”阶段的用电量。...
-
AIGC 爆火,浪潮信息要做大模型的数据存储大底座
AIGC 在 2023 年爆火,各类大模型层出不穷,参数动辄达到千亿数量级。这些背后,数据的类型和形式也走向复杂多样。例如大模型会采用到我们真实物理世界中的文字、视觉、音频、3D、雷达、多谱等复杂多样的不同模态信号和数据,数据则又存在结构化、半结构化、非结...
-
【Claude2体验】继ChatGPT,文心一言,Bing等大模型后,初次对话Claude2的体验
文章目录 ?注意事项 ?什么是Claude2 ⭐与之前版本的进步 ?官网的讲解 ?功能介绍 ?使用体验 ?查看不知道如何才能打开的文档 的内容 ?日常需求 ✨Claude ✨ChatGPT3.5 ?总结 ?专栏【小吉测评...
-
让AI模型成为GTA五星玩家,基于视觉的可编程智能体Octopus来了
电子游戏已经成为如今现实世界的模拟舞台,展现出无限可能。以游戏《侠盗猎车手》(GTA)为例,在 GTA 的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市 当中经历丰富多彩的生活。然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们是否也能有一...
-
微软禁止员工使用ChatGPT:担心机密数据泄露 推荐自家Bing Chat
快科技11月10日消息,据媒体报道,微软目前出于安全考虑,担心公司机密数据泄露,已经禁止员工使用ChatGPT。 微软表示,虽然微软确实投资了OpenAI,ChatGPT也有内置的保护措施来防止不当使用,但该网站仍然是第三方外部服务。 微软建议员工使用自家...
-
百度文心一言对标 ChatGPT,你怎么看?
文心一言 VS ChatGPT 接受不完美 期待进步 里程碑意义 文心一言初体验 ✔ 文学创作 ✔ 商业文案创作 ✔ 数理逻辑推算 ✔ 中文理解 ✔ 多模态生成 写在最后 何为文心?“文”就是我们中华语言文字中的文,“...
-
出于安全考虑 微软限制员工使用OpenAI ChatGPT
11月10日消息,虽然微软已经向人工智能研究公司OpenAI投资了100多亿美元,但这家软件巨头却在限制员工使用OpenAI的聊天机器人ChatGPT。 微软在其内部网站上的最新消息中表示:“出于安全和数据方面的考虑,许多人工智能工具不再供员工使用。”...
-
大模型勇闯洛圣都,加封「GTA五星好市民」!南洋理工、清华等发布视觉可编程智能体Octopus:打游戏、做家务全能干
随着游戏制作技术的不断发展,电子游戏已然成为现实世界的模拟舞台。 以游戏《侠盗猎车手》(GTA)为例,在GTA的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市)当中经历丰富多彩的生活。 然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们...
-
AIGC实战——深度学习 (Deep Learning, DL)
AIGC实战——深度学习 0. 前言 1. 深度学习基本概念 1.1 基本定义 1.2 非结构化数据 2. 深度神经网络 2.1 神经网络 2.2 学习高级特征 3. TensorFlow 和 Keras 4. 多层感知器 (MLP ...
-
15种工商数据的采集方法
目录 15种工商数据的采集方法 1、目前常用的15种数据网站 2.如何写Python爬虫: (1)爬虫的流程描述: (2)爬虫需要解决问题: (3)写爬虫需要安装的环境和工具: 3.人生第一个 爬虫代码示例: 另外:...
-
AGI通用人工智能几年内就会实现?三位科技大佬给出判断
2011年时谷歌DeepMind联合创始人Shane Legg曾预言,2028年之前AI有50%的概率可能会变得和人一样聪明。最近Shane Legg接受采访,他强调自己的观点未变,依然认为研究人员有50%的概率实现通用人工智能(AGI,又叫强人工智能...
-
让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)
最近微软一项研究让Llama 2选择性失忆了,把哈利波特忘得一干二净。 现在问模型“哈利波特是谁?”,它的回答是这样婶儿的: 木有赫敏、罗恩,木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈...
-
北大具身智能新成果:无需训练,听指令就能灵活走位
北京大学董豪团队具身导航最新成果来了: 无需额外建图和训练,只需说出导航指令,如: Walk forward across the room and walk through the panty followed by the kitchen. Stan...
-
字节“开盒”OpenAI所有大模型,揭秘GPT-3到GPT-4进化路径!把李沐都炸出来了
GPT-3究竟是如何进化到GPT-4的? 字节给OpenAI所有大模型来了个“开盒”操作。 结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。 比如: SFT是早期GPT进化的推动者 帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...
-
目前CIO们仍在谨慎地探索GenAI在企业中的应用价值
多数CIO已经开始探索GenAI,以确保企业跟上技术发展的趋势,但许多人发现,市场上的技术还没有达到理想的水平。米其林全球CIO Yves Caseau表示:“在对GitHub Copilot和ChatGPT进行了六个多月的试验后,GenAI的发展速度令...
-
你应该知道的十种机器学习算法
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 毫无疑问,机器学习/人工智能领域在将来是越来越...
-
AI智能超越人类终解开!李飞飞高徒新作破圈,5万个合成数据碾压人类示例,备咖啡动作超丝滑
AI巨佬Geoffrey Hinton称,「科技公司们正在未来18个月内,要使用比现在GPT-4多100倍的算力训练新模型」。 更大参数的模型,对算力需求巨大的同时,对数据也提出了更高的要求。 但是,更多的高质量数据该从何来? 英伟达高级科学家Jim F...
-
小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大
大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能,但是由于训练和推理大参数量模型需要大量的计算资源,导致高昂的成本,将大语言模型应用在专业领域中仍存在诸多现实问题。因此,北理团队先从轻量级别模型入手,最大程度发挥数据和模型的优势,立足更...
-
Nightshade 工具助力创作者保护版权 对抗 AI 训练数据的滥用
随着人工智能(AI)技术的快速发展,其训练数据的获取和使用变得日益重要,但也出现了滥用现象。为了抵御这种滥用,一款名为「Nightshade」的新工具应运而生,为创作者提供了一种保护他们创意作品不被无授权用于 AI 模型训练的方法。 Nightshade...
-
50张图“毒倒”Stable Diffusion,汽车和牛都分不清了
艺术家对AI侵权的反击来了—— 在画作里“投毒”,AI用了就会“中毒”出故障。 投毒工具由芝加哥大学团队打造,名为Nightshade,可以对画中像素添加隐形更改。 被下毒的画一旦被非法抓取成为训练数据被AI吃掉,模型就会生成混乱。 甚至还可能会破坏DA...