-
AI绘画使用Stable Diffusion(SDXL)绘制中国古代神兽
一、引言 说到神奇异兽,脑海中首先就会跳出我国古代神话传说中的各种神兽。比如青龙、白虎、朱雀、玄武,再比如麒麟、凤凰、毕方、饕餮等等,这些都是大家耳熟能详的的神兽。 这些神兽不仅体现了人们丰富的创造力和想象力,更是我国传统文化中的重要元素。 那么这...
-
LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与评测
引言 小伙伴们好,我是《小窗幽记机器学习》的小编:卖热干面的小女孩。 个人CSDN首页:JasonLiu1919_面向对象的程序设计,深度学习,C++-CSDN博客 今天开始以2篇小作文介绍代码大语言模型Code Llama。上篇主要介绍Co...
-
AIGC入门 - LLM 信息概览
在阅读本文之前,建议阅读文章:《GPT,GPT-2,GPT-3,InstructGPT的进化之路》 本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...
-
本地部署 Whisper 及 WhisperDesktop
本地部署 Whisper 及 WhisperDesktop 1. 什么是 Whisper 2. Github 地址 3. 创建虚拟环境 4. 安装 ffmpeg 5. 部署 Whisper 6. 使用 Whisper (20230514追加 W...
-
微调Whisper语音识别模型和加速推理
前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对W...
-
AIGC视频生成/编辑技术调研报告
人物AIGC:FaceChain人物写真生成工业级开源项目,欢迎上github体验。 简介: 随着图像生成领域的研究飞速发展,基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天,视频生成/编辑技术也引起了学术界和产...
-
【文心一言】文心一言最近这么火,它到底是什么
前言 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大...
-
Google Cloud 推出 Vertex AI 新的数据存储位置功能
Google 云服务部今日宣布,为其全套管理型人工智能开发服务 Vertex AI 引入了新的数据存储位置功能。 在诸如金融、医疗等受严格监管的行业中,企业通常需要将数据存储在产生数据的国家或地区。Google Cloud 推出的这一新功能正是为了满足这...
-
AI如何颠覆价值300亿美元的市场研究行业
正如Vuukle的创始人兼首席执行官Ravi Mittal所详细描述的那样,AI正在重塑市场研究行业。 市场研究行业的价值高达惊人的300亿美元,传统上被视为所有行业商业运营的关键基石,决定战略和塑造组织路径,然而,我们正站在AI带来的消费者洞察力的有...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
Google Bard VS ChatGPT:哪个是更好的AI聊天机器人?
文章目录 前言 一、Bard和ChatGPT的宏观对比 二、应用场景不同 三、知识的时效性 四、未来的归宿 总结 前言 自从 OpenAI 向公众发布ChatGPT以来的过去几个月里,我们都见证了围绕 ChatGPT 的各种测评...
-
浅析半监督学习及其应用场景
Labs 导读 随着互联网的发展,企业可以获得越来越多的数据,这些数据可以用于帮助企业更好的了解用户,即客户画像,也可以用来改善用户的体验。但这些数据中可能存在大量没有标记的数据。如果所有数据均采用人工标记的方式则存在两方面的缺点,一是花费的时间成本较...
-
Yolo V8:深入探讨其高级功能和新特性
Yolo是一种计算机视觉模型,被广泛认为是目前最强大和最知名的模型之一。这一突破性技术被称为Yolo,它是“You Only Look Once”的缩写,是一种以几乎瞬间处理速度检测物体的方法。Yolo V8技术是这一技术的最新版本,也是对之前版本的一种...
-
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。 视频是一种多功能媒介,可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法,就能帮助人们设计出具备强大能力的认知机器 —— 它不...
-
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?
近期, OpenAI 的开发者大会迅速成为各大媒体及开发者的热议焦点,有人甚至发出疑问“向量数据库是不是失宠了?” 这并非空穴来风。的确,OpenAI 在现场频频放出大招,宣布推出 GPT-4 Turbo 模型、全新 Assistants API 和一系...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
不是LlaMa套壳!李开复麾下大模型陷套壳争议,团队二次回应来了!
整理丨诺亚、小欧 出品 | 51CTO技术栈(微信号:blog51cto) 昨天科技圈社区Hacker News突然出现一则消息,矛头直指不久前发布的大模型Yi-34B,认为其除了两个张量被重新命名外,完全使用了Llama的架构。 图片 而根据公开信息,...
-
解释:生成式 AI的工作机制与差异
像 ChatGPT 这样强大的生成式 AI 系统是如何工作的,它们与其他类型的人工智能有何不同? 快速浏览一下头条新闻,就会发现生成式人工智能如今无处不在。事实上,其中一些标题实际上可能是由生成式人工智能撰写的,例如 OpenAI 的 ChatGPT,...
-
大模型幻觉排行榜GPT-4夺冠,英伟达科学家强力打假!Meta版ChatGPT一作发长文鸣冤
大模型的幻觉问题,是业内老生常谈的话题了。 最近,一个名为Vectara的机构,在GitHub推出了一个大模型幻觉排行榜。 结果显示,在总结短文档方面,GPT-4的表现最为优异,而Google Palm的两款模型直接垫底! 其中GPT-4的准确率为97...
-
北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断
手是人类与世界交互的重要部分,手的缺失(如上肢残障)会大大影响人类的正常生活。 北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS 2023接...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
Ghostbuster:一个准确度高的AI生成文本检测工具
大语言模型如ChatGPT,以其卓越的写作能力引发了问题。学生们纷纷利用这些模型代写作业,导致一些学校不得不采取禁止ChatGPT的措施。此外,这些模型还存在生成带有事实错误的文本的倾向,因此谨慎的读者可能想知道,在信任某些新闻文章或其他来源之前,是否有生...
-
C3 AI与AWS扩大战略合作协议
C3 AI是一家企业人工智能应用软件公司,今天宣布扩大其与亚马逊网络服务(AWS)的战略合作协议,旨在为各行业客户提供旨在解决关键业务挑战的人工智能解决方案。根据扩大的战略合作协议,C3 AI和AWS将继续专注于为企业提供先进的生成式人工智能解决方案。...
-
如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路
在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。 在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。 数栈为什么选择实时湖仓...
-
如何利用人工智能释放非结构化数据的力量
随着几乎所有垂直行业都走向数字化,人们常说“数据就是新石油”。然而,人们往往没有足够重视的是,石油在经过精炼并以柴油、汽油、天然气或航空燃料等所需形式存在之前,不适合驱动我们的机器,非结构化数据的情况几乎相同。 据估计,非结构化数据约占全球组织生成和存...
-
研究人员教会GPT-4V使用iPhone并在亚马逊应用程序上购物
在当今智能手机技术不断发展的世界中,对能够导航和与移动应用程序复杂界面进行交互的人工智能的需求不断增加。MM-Navigator通过使用GPT-4V代理来满足这一需求,该代理结合了图像处理和文本推理,使其能够在iPhone上执行购物任务。本文将着重介绍MM...
-
[算法前沿]--000-大模型LLaMA在docker环境搭建以及运行教程(含模型压缩)
文章目录 LLaMA 论文 步骤 搭建步骤 运行7B模型 运行13B模型 未来已来,大模型依据压缩模型的方式,可以在普通的PC上运行. LLaMA Facebook的LLaMA 模型和Georgi Gerganov 的ll...
-
ImageBind与Stable diffusion使用记录
参考代码 ImageBind:GitHub - facebookresearch/ImageBind: ImageBind One Embedding Space to Bind Them All ImageBind + stable-diffusio...
-
抖音AI绘画变成真人软件
抖音AI绘画成人软件的发展可能包括以下几个方面: 算法优化:随着深度学习算法的不断发展,未来该技术可能会通过改进模型架构、优化训练方式等手段,提高生成图像的质量和自然度。 多样化的绘画风格:为了满足用户个性化的需求,未来的AI绘画成...
-
大模型幻觉率排行:GPT-4 3%最低,谷歌Palm竟然高达27.2%
人工智能发展进步神速,但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好,后脚又因幻觉问题令人不禁吐槽。 幻觉一直是大模型的致命缺陷。由于数据集庞杂,其中难免会有过时、错误的信息,导致输出质量面临着严峻的考验。过多重复的信息还会...
-
GPT-5 正在开发中!OpenAI:希望微软能再给资金支持
今年6月,OpenAI CEO Sam Altman 在印度经济时报主办的一场会议上表示:“在我们开始训练下一代模型之前,我们还有很多工作要做。我们正在研究我们认为需要的新想法,但我们肯定还没有准备好开始。” 仅时隔半年后,在OpenAI刚带来全新的GPT...
-
微软AI研究提出AI模型HMD-NeMo:可基于部分手部动作准确生成全身动作
在混合现实场景中,生成准确和真实的全身虚拟角色动作一直是一个持久性的挑战。传统解决方案通常使用头戴式设备(HMDs),依赖有限的输入信号,如头部和手部的6自由度(DoF 。然而,最近的进展在从头部和手部信号生成全身动作方面取得了令人印象深刻的表现。然而,它...
-
中国AIGC数据标注全景报告:百亿市场规模,百万就业缺口
数据标注,正迎来关键洗牌时刻。 大模型时代到来,以数据为中心的AI开发模式加速走向台前,数据的价值从未向今天这样被充分挖掘—— 大模型从训练到部署应用迭代,AIGC众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化的场景数据密不可分。...
-
OpenAI首席执行官透露GPT-5正在开发中
11月14日消息,据外媒报道,OpenAI已经开始构建GPT-5。该公司首席执行官Sam Altman在最近的一次采访中证实了这一点,并声称它可以超级智能,但该公司需要其长期合作伙伴微软的进一步投资才能使其成为现实。 Altman表示,与微软的合作进展...
-
GPT-5已开工!奥特曼:月入7亿不够烧,希望微软再投点
月入7个亿,仍然覆盖不了训练GPT的海量投入。 这是OpenAI CEO奥特曼公开透露的最新信息。 他对《金融时报》表示,OpenAI今年收入增长良好,但公司仍未盈利。OpenAI计划继续从金主爸爸微软和其他投资者那里筹集资金—— 而就在今年初,已有微...
-
Silo AI面向欧洲推新开源语言模型“Poro” 涵盖欧盟24种语言
芬兰赫尔辛基的人工智能初创公司Silo AI本周发布了Poro,这是一个旨在提升欧洲语言多语言人工智能能力的新开源大型语言模型(LLM)。Poro是计划中的首个开源模型,旨在最终涵盖欧盟所有24种官方语言。这些模型由Silo AI的SiloGen生成人工智...
-
企业对生成式AI的投资低得惊人 在云支出中占比不到1%
2023年,生成式AI备受关注,被认为是能够在多个领域实现变革的突破性技术,甚至被寄予改变人类生活的希望。然而,Menlo Ventures报告显示,尽管生成式AI在2023年取得突破,但这主要是一场炒作。 报告指出,生成式AI在企业云支出中所占比例“相对...
-
LLaMA微调记录
本文基于开源代码https://github.com/Lightning-AI/lit-llama/tree/main执行微调 其他参考链接: Accelerating LLaMA with Fabric: A Comprehensive Guide...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
-
OpenAI创始人透露 GPT5已在训练中
在最新一期的FT采访中,OpenAI CEO Sam Altman透露了公司的多项规划,展望未来。首先,公司与微软的合作进展顺利,预计将从科技巨头和其他投资者处筹集更多资金,以解决构建更复杂AI模型的高昂成本问题。这与早些时候微软向OpenAI投资100亿...
-
【AIGC】浅谈人工智能对各行业的影响及未来展望
前言 本文将探讨人工智能对各个行业的影响,以及如何更好地利用人工智能技术。同时,我们还将介绍在使用人工智能技术时需要注意的问题,并展望未来人工智能的发展前景。 随着科技的不断发展,人工智能已经成为了当今世界上最受关注和研究的领域之一。在过去几年中,人...
-
创作没灵感?可视化图谱+搜索引擎助你无障碍生成内容 #ATLAS + Stable Diffusion
AIGC 的发展带动了内容创作产品生态的变革。从纯粹的设计生产工具,扩展到数据集、内容社区、搜索引擎等功能形式多样的产品。对于设计师而言,生成式设计工具与传统设计工具的区别,主要体现在工作流。 Mixlab 小杜 传统设计工具...
-
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
可以说,AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。 7 月 19 日,Meta 终于发布了免费可商用版本 Llama 2,让开源大模型领域的格局发生了巨大变化。 Llama 2 模...
-
自动代码Copilot背后的模型
文章目录 1.引入 2.评估框架 3.评估数据集 4.模型方法 5.实验结果 6.总结 7.参考 之前,我已经介绍过Github发布的自动代码Copilot的使用方法,感兴趣的可以看这篇文章:Copilot要收费了? 今天主要介绍一...
-
Stable Diffusion 原理介绍与源码分析(二、DDPM、DDIM、PLMS算法分析)
Stable Diffusion 原理介绍与源码分析(二、DDPM、DDIM、PLMS) 文章目录 Stable Diffusion 原理介绍与源码分析(二、DDPM、DDIM、PLMS) 系列文章 前言(与正文无关,可忽略) 总览...
-
详解超强ResNet变体NFNet:抛弃归一化后,性能却达到了最强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从上古时期一直到今天,Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络,并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...
-
Stable Diffusion - 扩展 Roop 换脸 (Face Swapping) 插件的配置与使用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131856141 官网:GitHub - roop,参考论文:Ro...
-
解锁AI和ML在医疗保健领域潜力
在医疗保健领域,人工智能(AI 和机器学习(ML 逐渐为患者护理、诊断和治疗带来了显著的进步。这些尖端技术彻底改变了医疗保健行业,提高了准确性、效率和个性化护理。早期疾病检测、精准医疗、医学成像进步、虚拟健康助手和药物发现就是这些技术如何重塑医疗保健实践...
-
GPT Store什么时候上线?OpenAI GPTs官方商店地址入口
在OpenAI最近的开发日上,我们看到了一系列令人兴奋的发布。除了GPT-4Turbo和AssistantsAPI的推出外,我们还看到了有关GPT、用户创建的ChatGPT定制版本以及GPT商店的信息。 GPTs是ChatGPT的定制版本,您可以针对特定...
-
无监督学习的集成方法:相似性矩阵的聚类
在机器学习中,术语Ensemble指的是并行组合多个模型,这个想法是利用群体的智慧,在给出的最终答案上形成更好的共识。 这种类型的方法已经在监督学习领域得到了广泛的研究和应用,特别是在分类问题上,像RandomForest这样非常成功的算法。通常应用一...