-
基于LLaVA开源模型打造视频聊天助手
简介 大型语言模型已经证明自己是一项革命性的技术。目前,人们已经开发出了许多基于大型语言模型功能的应用程序,而且预计很快还会有更多的应用程序问世。大型语言模型最有趣的应用之一是将其部署为智能助手,它们能够帮助人类用户完成各种任务。 人们已经能够通过指令微...
-
OpenAI豪赌7万亿,能买4个英伟达!奥特曼芯片帝国占全球GDP 10%,或引世界经济末日?
昨天,Sam Altman筹资7万亿美元建芯片帝国的新闻一出,舆论哗然。 7万亿美元,是全球GDP的10%,大约是美国GDP的1/4,或者2/5个中国的GDP。 这个数字实在令人难以理解,除非OpenAI确信,自己的技术就从根本上重塑整个世界。否则,人...
-
上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务
本文首发于微信公众号 CVHub,未经授权不得以任何形式售卖或私自转载到其它平台,违者必究! Title: LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-...
-
Llama-7b-hf和vicuna-7b-delta-v0合并成vicuna-7b-v0
最近使用pandagpt需要vicuna-7b-v0,重新过了一遍,前段时间部署了vicuna-7b-v3,还是有不少差别的,transforms和fastchat版本更新导致许多地方不匹配,出现很多错误,记录一下。 更多相关内容可见Fastchat实战...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
【AIGC】prompt工程从入门到精通
注:本文示例默认“文心大模型3.5”演示,表示为>或w>(wenxin ,有时为了对比也用百川2.0展示b>(baichuan 有时候为了模拟错误输出,会用到m>(mock 表示(因为用的大模型都会给出正确答案) 有时候直接贴网络...
-
大模型真能解决一切吗?关于知识驱动自动驾驶的一些思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座,刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的,所以开这么个帖子把其中一些关...
-
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相较之下,我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数,还包...
-
.Net接入AzureOpenAI、OpenAI、通义千问、智谱AI、讯飞星火、文心一言大语言模型。
前言 现在在网上搜索.NET接入大模型的帖子很少,有些官方案例只提供java和python的SDK,所以有了这篇.Net的接入大模型文章,目前仅实现对话模型的调用。 这里仅举例通义千问,其他模型实现可以参考Gi他Hub 对您有帮助的话帮忙点个star...
-
人类和AI的决策协作:决策问题的表述、解释和评价
在人工智能、数据可视化等领域,如何利用信息显示来辅助人类做出更好的决策,是一个重要的研究目标。什么是一个决策问题,以及如何设计一个能够有效评估人类决策的实验,没有一个明确的共识。在这篇文章中,我将为您解读一篇最新的论文,它提出了一个基于统计决策理论和信息...
-
AI虚拟陪伴聊天应用如此火爆,为什么没有中国版Character.ai出现?
三句话,让生气的AI恋人原谅我。 最近,一款名为“哄哄模拟器”的AI聊天产品突然走红。 与单纯提供陪伴、情绪价值的AI聊天应用不同,哄哄模拟器更像是一个练习高情商对话的小游戏。 游戏内预设了多种常见的情侣吵架场景,包括但不限于: 你需要想方设法在限...
-
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。 在这一背景下,M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...
-
AI时代来了,专业摄影师会被淘汰吗?
现在科技界几乎已经形成一种共识,即随着AI的进化,很多职位将会被替代,当中就包括专业摄影师。 Medium在报告中指出:“随着AI和图像处理技术的发展,摄影正在从高技巧创作变成了以技术驱动的创作。在技术的加持下,即使是普通用户,也可以拍出高质量影像,传...
-
高效底座模型LLaMA
论文标题:LLaMA: Open and Efficient Foundation Language Models 论文链接:https://arxiv.org/abs/2302.13971 论文来源:Meta AI 一、概述 大型语...
-
在PyCharm中安装GitHub Copilot插件,login之后报出如下错误:
Sign in failed. Reason: Request signInInitiate failed with message: connect ECONNABORTED 20.205.243.166:443, request id: 7, erro...
-
一文读懂Stable Diffusion 论文原理+代码超详细解读
背景 Stable diffusion是一个基于Latent Diffusion Models(LDMs)实现的的文图生成(text-to-image)模型。 2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院(Théâtre...
-
AIGC内容分享(十九):插上 AIGC 翅膀的 Kubernetes AIOps工具 - K8sGPT
目录 介绍 概述 K8sGPT 安装 配置 OpenAI 初步尝试 根因分析 更多用法 总结 介绍 因为 AIGC的巨大成功, AIOps 中引入大语言模型也引起了很多人的关注,这其中 Kubernetes 为代表的基础...
-
生成式AI:CIO在工作场所中遇到的一个未知因素
确保组织最终用户和日益智能的软件工具这两者之间形成富有成效的合作伙伴关系,这对于生成式AI战略的成功来说是至关重要的,其中需要指导和引导。 在急于制定技术战略以兑现有关生成式AI的承诺时,许多CIO发现自己正在一头扎进可能是他们迄今为止最具挑战性的任务...
-
「think step by step」还不够,让模型「think more steps」更有用
如今,大型语言模型(LLM)及其高级提示策略的出现,标志着对语言模型的研究取得了重大进展,尤其是在经典的 NLP 任务中。这其中一个关键的创新是思维链(CoT)提示技术,该技术因其在多步骤问题解决中的能力而闻名。这项技术遵循了人类的顺序推理,在各种挑战中...
-
马作的卢飞快!上海AI Lab发布首个模仿人类学习范式的自动驾驶决策框架DiLu
本文经自动驾驶之心公众号授权转载,转载请联系出处。 DiLu(的卢)是首个基于AI Agent范式的知识驱动自动驾驶框架,其结合了常识知识和大语言模型,通过记忆模块以实现闭环自动驾驶决策制定并拥有持续进化的能力。通过不断对环境的交互积累经验,自我反思纠...
-
异常值检测方法比较——基于美国职业棒球联盟2023赛季击球数据
译者 | 朱先忠 审校 | 重楼 异常值检测是一种无监督的机器学习任务,用于识别给定数据集中的异常(即“异常观测”)。在大量现实世界中,当我们的可用数据集已经被异常“污染”时,异常值检测任务对于整个机器学习环节来说是非常有帮助的。当前,开源框架Sciki...
-
LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞
自从ChatGPT发布后,各种基于大模型的产品也快速融入了普通人的生活中,但即便非AI从业者在使用过几次后也可以发现,大模型经常会胡编乱造,生成错误的事实。 不过对于程序员来说,把GPT-4等大模型当作「代码辅助生成工具」来用的效果明显要比「事实检索工具...
-
世界顶尖多模态大模型开源!又是零一万物,又是李开复
领跑中英文两大权威榜单,李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布,仅间隔不到三个月的时间。 模型名为Yi Vision Language(Yi-VL),现已正式面向全球开源。 同属Yi系列,同样具有两个版本...
-
ChatGPT无法胜任的五种编程任务
作者丨Nate Rosidi 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 我喜欢把ChatGPT看作是StackOverflow的智能版,它大有帮助,但短期内不会取代专业人士。作为一名前数据科学家,Cha...
-
争议不断的AI绘画,如今成为了顶流?
今年以来,AIGC迅速崛起。 所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。 在...
-
GPU+生成式人工智能助力提升时空数据分析
译者 | 朱先忠 审校 | 重楼 摘要:通过实战案例介绍,本文指出随着基于GPU加速的数据库技术为时间序列和空间数据带来更好的性能和精度水平,生成式人工智能技术将使得非领域专家也能够进行复杂的时空数据处理。 引言 时空数据来自手机、气候传感器、金融市场交...
-
小扎砸数百亿美元猛攻开源AGI!狂掷60万块H100,爆50倍GPT-4算力
【新智元导读】今天,小扎正式宣战「开源AGI」!下一代大模型Llama3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。 自Llama2、Code Llama...
-
最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发
Mixtral 8x7B开源模型的诞生,正如Llama一样,为开源社区了带来曙光。 前段时间,Mixtral刚刚发布了8x7B模型的论文。在基准测试结果中,其性能达到或超过 Llama 2-70B和GPT-3.5。 甚至,Mixtral在数学、代码生成和...
-
如何使用ChatGPT + Midjourney批量生成图片
我们都知道,视觉内容对于一个内容创作者来说非常重要。但是,对于没有设计技能的人来说,制作视觉内容可能是一项很困难的任务。不过,随着人工智能技术的不断进步,我们可以使用一些AI工具来帮助我们创建视觉内容,例如使用ChatGPT和Midjourney批量生成图...
-
字节跳动基础架构SRE-Copilot获得2023 CCF国际AIOps挑战赛冠军
近日,2023 CCF国际AIOps挑战赛决赛暨“大模型时代的AIOps”研讨会在北京成功举办,活动吸引了来自互联网、运营商、科研院所、高校、软硬件厂商等领域多名专家学者参与,为智能运维的前沿学术研究、落地生产实践打开了新思路。决赛中,从初赛两百多支...
-
Java调用Midjourney进行AI画图原生版抓包实现支持中文
用途介绍 Midjourney是一个目前优秀的AI画图工具,不挂梯无法直接访问 本代码主要用于搭建镜像站使用 适合人群 本代码不适合新手,建议使用过okhttp、且具有二开能力的同学使用~ 实现原理 通过调用发送信息接口发送请求,通过轮询房间消...
-
AI看图猜位置,准确率超90%!斯坦福最新PIGEON模型:40%预测误差不到25公里
随手在网络上发布的一张照片,能暴露多少信息? 外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战,网友提供照片,他来猜测照片的具体拍摄地,有些照片甚至还能猜到具体的航班细节。 是不是细思极恐? 但「照片挑战」也同样抚慰了很多人心中的遗憾,...
-
谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病
【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生,通过了图灵测试,再次引领医疗AI的革命。 我们需要研发对人类有益AGI的原因之一: OpenAI联创Greg Brockman的一番话点明,当前先进A...
-
谷歌千人被裁引硅谷裁员潮!27家公司宣布裁员,90%大厂码农工作遭AI冲击
过去一年,AI大模型如火如荼的发展,让所有人憧憬着美好未来。 没想到2024年的开启,却是硅谷大裁员! 大厂谷歌却是首当其冲,裁员1000多人,涉及了核心工程、谷歌助理、Pixel手机等硬件团队的人员。 截至2023年9月30日,谷歌拥有18.2万名员工...
-
2024年大数据行业预测(一)
分析 随着全渠道商务的发展,广告分析领域将发生翻天覆地的变化。线上和线下消费者互动之间的传统孤岛正在瓦解,为真正的全渠道消费者铺平了道路。虽然实体/数字围墙在消费者的旅程中逐渐倒塌,但围墙花园和消费者隐私问题仍将凸显,使分析变得复杂。全渠道消费者的增长...
-
争议不断的AI绘画,靠啥成为了顶流?
今年以来,AIGC迅速崛起。 所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。 在...
-
Make-A-Video(造啊视频)——无需文字-视频数据的文字转视频(文生视频)生成方法
© 2022 Uriel Singer et al (Meta AI © 2023 Conmajia 本文基于论文 Make-A-Video: Text-to-Video Generation without Text-Video Data(220...
-
AI平台:NVIDIA Toronto AI Lab
站点网址:https://nv-tlabs.github.io...
-
ChatGPT+Ai绘图【stable-diffusion实战】
ai绘图 stable-diffusion生成【还有很大的提升空间】 提示词1 Picture a planet where every living thing is made of light. The landscapes are bre...
-
解决JetBrains IDE中使用GitHub Copilot报错(code:-32603)问题(已挂代理)
简介 在JetBrains IDE中使用GitHub Copilot遇到-32603报错。 本文重点介绍挂了tz开全局代理后依然遇到该问题的解决方法。 报错详情 GitHub Copilot Sign in failed.Reason:Re...
-
大模型中幻觉缓解技术的综合调查
大型语言模型(LLMs)是具有大量参数和数据的深度神经网络,能够在自然语言处理(NLP)领域实现多种任务,如文本理解和生成。近年来,随着计算能力和数据规模的提升,LLMs取得了令人瞩目的进展,如GPT-4、BART、T5等,展现了强大的泛化能力和创造力。...
-
AIGC: 关于ChatGPT中Function Call的调用
Function Call 概念 关于 GPT 中API的function参数,提供了一些能力 这个函数调用是 Open AI 在2023年的6.13号发布的新能力 根据它的官方描述, 函数调用能力可以让模型输出一个请求调用函数的消息 其中包...
-
使用Google大模型Bard(PaLM)理解时间序列预测模型ARIMA
使用Bard模型理解时间序列预测模型ARIMA Q: explains ARIMA model (注释:让Bard解释下时间序列预测模型ARIMA Q: explains the AR sub model in ARIMA model, gi...
-
lag-llama源码解读(Lag-Llama: Towards Foundation Models for Time Series Forecasting)
Lag-Llama: Towards Foundation Models for Time Series Forecasting 文章内容: 时间序列预测任务,单变量预测单变量,基于Llama大模型,在zero-shot场景下模型表现优异。创新点,引入滞后...
-
Github Copilot 的补强工具Github Copilot Labs的常用功能介绍
一、什么是Github Copilot Labs Github Copilot Labs是由GitHub推出的一款基于人工智能技术的代码协作工具,旨在协助开发者更加快速、高效地编写代码。该工具使用了机器学习技术,通过学习大量的开源代码和编写实践,提供了...
-
15位大咖预测:2024年AI将改变网络安全游戏规则
随着AI技术的突破性发展,攻击者正在加速AI的武器化,结合社会工程技术让企业防不胜防;与此同时,在防御侧,AI也是CISO赢得人工智能军备竞赛的关键武器。 2024年,AI将如何改变网络安全的游戏规则?近日,科技媒体VentureBeat采访了13家公...
-
史上最大AI版权案深度分析!OpenAI必败,还是纽约时报胜率为0?
纽约时报起诉OpenAI和微软的案子,可能成为影响AI技术发展的里程碑式案例。 《纽约时报》作为西方传统媒体中影响力最大的机构之一,下场与代表AI技术「最先进生产力」的OpenAI开撕,本身就话题性十足。 图片 一位传统媒体人Jason Kint,在读完...
-
LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention
Paper name LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Paper Reading Note Paper URL: htt...
-
midjourney指令笔记+踩坑日记+gpt论文润色指令
跟人拼团入手了midjourney,长期记录更新。 midjourney指令笔记+踩坑日记 指令笔记 踩坑日记 GPT论文润色指令 指令一 指令二 指令三 指令四 指令五 指令笔记 关键词参考网址:prompttool...
-
OpenAI Whisper + FFmpeg + TTS:动态实现跨语言视频音频翻译
本文作者系360奇舞团前端开发工程师 摘要: 本文介绍了如何结合 OpenAI Whisper、FFmpeg 和 TTS(Text-to-Speech)技术,以实现将视频翻译为其他语言并更换声音的过程。我们将探讨如何使用 Ope...