-
AIGC for code(text-to-codeAIGC/AI生成代码/生成式AI之代码生成/AI编程工具/自动编程/自动生成代码/智能编程工具/智能编程系统)
AIGC,Artificial Intelligence Generated Content,人工智能生成内容 AIGC for code,AI生成代码 1 Github Copilot 1.1 简介 Copilot是由微软的子公司Github与o...
-
OpenAI Whisper论文笔记
OpenAI Whisper论文笔记 OpenAI 收集了 68 万小时的有标签的语音数据,通过多任务、多语言的方式训练了一个 seq2seq (语音到文本)的 Transformer 模型,自动语音识别(ASR)能力达到商用水准。本文为李沐老师论文精...
-
Speaking AI官网体验入口 AI声音克隆工具软件网页版app免费使用地址
Speaking AI是一款利用先进大语言模型技术实现文本到语音转换的工具。它不仅能以自然的情感进行对话,还实现了零样本语音克隆,能够捕捉并复制独特的音调、音高和调节。这一突破性技术让语音克隆听起来更加自然,是个人创作和娱乐场景的理想选择。 点击前往Sp...
-
AI在操作系统里复制自己,这一天还是来了
这一天还是来了,AI在操作系统里启动了一个自己的副本。 往小了说,不过是多模态大模型通过操纵鼠标键盘的API执行任务。 往大了说,也可以算是“AI复制自己”的雏形了。 (别被作者的蓝天白云壁纸骗到了,这其实是MacOS) 从AI这一顿眼花缭乱的操作中...
-
基于llama-index对embedding模型进行微调
QA对话目前是大语言模型的一大应用场景,在QA对话中,由于大语言模型信息的滞后性以及不包含业务知识的特点,我们经常需要外挂知识库来协助大模型解决一些问题。在外挂知识库的过程中,embedding模型的召回效果直接影响到大模型的回答效果,因此,在许多场景下,...
-
公司如何使用GenAI来防范ChatGPT泄漏数据
根据哈佛大学最近的一项研究,公司员工的工作效率提高了40%,这要归功于基于哈佛大学的一项研究。麻省理工学院的另一项研究发现,ChatGPT减少了技能不平等,加快了文档创建时间,同时使公司员工能够更高效地利用时间。ChatGPT正在帮助公司员工在更短的时...
-
新型AI架构AGI-Samantha 可模拟人类大脑思考和自主交流能力
AGI-Samantha是一种新型的AI架构,利用多个LLM联动来模拟人类的大脑思考、记忆、感知和自主交流能力。它能够根据周围环境和情境自主决定何时进行交流对话,并拥有一种特殊的记忆系统,能够根据情境的相关性选择存储和回忆信息,并根据这些进行自我迭代进化。...
-
AI战争迫近,ChatGPT解除军用禁令
上周末,人工智能领头羊企业OpenAI悄悄从ChatGPT使用政策中删除了禁止应用于军事用途的条款,这标志着人工智能武器化的潘多拉盒子已经打开。 值得注意的是,在OpenAI新政策曝光前不到一个月,美国国防部副部长希克斯在访问加州期间曾宣称,美国军方与...
-
深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐
继第一份大模型对齐技术报告(Secrets of RLHF in Large Language Models Part I)获 NeurIPS 2023 workshop best paper 后,第二份报告强势归来,复旦语言和视觉团队联合推出的第二...
-
【LLM】微调LLM:LoRA 还是全参数?Llama 2 的深入分析
🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝 📣系列专栏 - 机器学习【ML】 自然语言...
-
Transformer的无限之路:位置编码视角下的长度外推综述
在自然语言处理(Natural Language Processing,NLP)领域,Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而,Transformer 及在其基础之上的大语言模型(Large Language Model...
-
AI视野:阿里推ReplaceAnything框架;OpenAI取消军用禁令;Pika推视频画面扩充功能;SD推图生视频插件I2V-Adapter
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 👨💻💡🎯聚焦开发者 阿里推Rep...
-
大模型伪装「潜伏特工」学会欺骗!OpenAI劲敌重磅研究震惊马斯克
不要教LLM学会骗人!不要教LLM学会骗人!不要教LLM学会骗人! 因为后果可能会很严重,甚至超出人类的想象。 最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶...
-
软件开发人员指南:在自己的数据上训练ChatGPT
译者 | 李睿 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI公司推出的ChatGPT对于对话式人工智能具有革命性意义。虽然其开箱即用的功能令人印象深刻,但ChatGPT的功能本质上受到2021年固有训练数据的...
-
OpenAI修改其AI模型使用政策,取消对军用应用明确禁令
OpenAI最近宣布对其AI模型使用政策进行修改,取消了以往对“军 事和战争”应用的明确禁令。这一调整被解释为将禁令内容融入更广泛的四项通用原则中,如“不要利用我们的服务伤害自己或他人”,或者“不要重新利用或分发我们服务的输出以伤害他人”。 OpenAI发...
-
可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG-Bench Mistake 数据集
IT之家 1 月 15 日消息,谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集,并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行了一系列评估研究。 谷歌研究人员表示,由于...
-
大模型部署手记(13)LLaMa2+Chinese-LLaMA-Plus-2-7B+Windows+LangChain+摘要问答
1.简介: 组织机构:Meta(Facebook) 代码仓:GitHub - facebookresearch/llama: Inference code for LLaMA models 模型:chinese-alpaca-2-7b-hf、text...
-
LLM AutoEval:AI平台自动评估Google Colab中的LLM
在自然语言处理领域,语言模型的评估对于开发人员推动语言理解和生成的边界至关重要。LLM AutoEval是一款旨在简化和加速语言模型(LLMs)评估过程的工具,专为寻求快速高效评估LLM性能的开发者定制。 LLM AutoEval具有以下关键特点: 1....
-
揭秘硅谷巨头AI初创公司投资布局!英伟达ALL IN,微软-OpenAI式关系引反垄断调查
今年以来,一批新的人工智能初创企业震撼了硅谷乃至更广泛的商业世界: OpenAI是世界上最前沿的大模型提供商和技术灯塔。甚至OpenAI每发一篇博客,都能获得全世界大模型从业者的高度关注。 图片 来自法国,只有22名员工的Mistral AI,每次发布一...
-
Mistral AI推出Mixtral 8x7B:一种改变机器学习的SMoE语言模型 效果堪比GPT-3.5
## 划重点: 1. 🚀 **创新模型介绍:** Mistral AI 的研究团队推出了基于 Sparse Mixture of Experts(SMoE)模型的 Mixtral8x7B 语言模型,采用开放权重。 2. 🌐 **性能突出:** Mixtra...
-
ChatGPT在亚马逊上「开网店」,一夜之间成了网红
「我们的 [产品] 可用于多种任务,例如 [任务 1]、[任务 2] 和 [任务 3],使其成为你家庭的多功能补充。」 没想到,ChatGPT 的机器人话竟然在电商网站上火了。 GPT-5 的发布还尚需时日,最近 OpenAI 正在发力大语言模型的...
-
【网安AIGC专题10.11】论文1:生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)
论文1:Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面 论文总结 背景知识介绍 语言模型 双向语言模型 单向语言模型 自动程序修复(...
-
精确指出特定事件发生时间!字节&复旦大学多模态大模型解读视频太香了
字节&复旦大学多模态理解大模型来了: 可以精确定位到视频中特定事件的发生时间。 比如在下面这个视频中: 狗子转身看镜头时的时间戳是多少? 什么时候用爪子推开滑板? 在这里,视频中的宝宝什么时候推起眼镜、舒展了一下身体?又是什么时候翻的书? 对...
-
能找神经网络Bug的可视化工具,Nature子刊收录
研究人员发现,在神经网络推理的某些数据图中存在尖峰,这些尖峰往往出现在神经网络判断模糊与产生错误的地方。观察这些尖峰,研究人员可以更容易发现人工智能系统中的故障点。 从分析癌症突变的原因到决定谁应该获得贷款,在解决这些问题的过程中,仿照人脑的神经网络比人...
-
五种资源类别,如何提高大语言模型的资源效率,超详细综述来了
近年来,大型语言模型(LLM)如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型,具有庞大的参数量(例如 1750 亿个参数),在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进,这些模型在从智能聊天机器...
-
AI机器人席卷CES!OpenAI暗自解除ChatGPT军事应用限制,天网来了?
前一阵的斯坦福「炒虾机器人」,让无数人感慨:2024年怕不是要成为机器人元年? 就在这几天的CES 2024上,又一大波机器人在展厅里引起了轰动! 比如这个机器人咖啡师,娴熟地将一壶光滑的泡沫牛奶倒在拿铁咖啡上。 开始,它会慢慢倒出牛奶,随后,它优雅...
-
当AI变成“守法公民”,为何用户反而不爱它了
ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在,但投入AI大模型赛道的显然远远不止OpenAI一家,例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢,比如创业...
-
如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术
在人工智能(AI)的快速发展背景下,大语言模型(LLMs)凭借其在语言相关任务上的杰出表现,已成为 AI 领域的重要推动力。然而,随着这些模型在各种应用中的普及,它们的复杂性和规模也为其部署和服务带来了前所未有的挑战。LLM 部署和服务面临着密集的计算强...
-
基于AI的事件智能分析系统建设实践
一、背景 当前,随着虚拟化、云计算等新技术的广泛应用,企业数据中心内部IT基础设施规模成倍增长,计算机硬件和软件的规模不断的扩大,相应的计算机故障也频繁发生,一线运维人员迫切的需要更加专业、更加强大的运维工具。 在数据中心的日常运维工作中,一般是通过...
-
AIGC:ChatGPT(一个里程碑式的对话聊天机器人)的简介(意义/功能/核心技术等)、使用方法(七类任务)、案例应用(提问基础性/事实性/逻辑性/创造性/开放性的问题以及编程相关)之详细攻略
AIGC:ChatGPT(一个里程碑式的对话聊天机器人 的简介(意义/功能/核心技术等 、使用方法(七类任务 、案例应用(提问基础性/事实性/逻辑性/创造性/开放性的问题以及编程相关 之详细攻略 导读:回拨到2020年5月,OpenAI提出了更...
-
AI绘画权益纠纷:你的创作是否触碰了版权底线?
最近,北京互联网法院就一起人工智能生成图片(AI绘画图片)的著作权侵权案进行了首次审理并做出了判决。这是中国首例牵涉到“AI文生图”著作权的案件,庭审过程在多个平台进行直播,吸引了众多网友,同时引发了对于AI生成内容与著作权之间关系的广泛讨论。 那么近年...
-
一文读懂 LLM 可观测性
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM (大型语言模型 可观测性 ,本文将继续聚焦在针对 LLM 的可观测性进行解析,使得大家能够了解 LLM 的可观测性的必要性以及其核心的生态体系知...
-
AI 时间是能编辑的,空间是可计算的 |N4 连麦对谈 AIGC
本期关键词:AIPC、生成式AI、ComfyUI、应用、场景、超级个体、算力、数据、组织模式、范式更新、AI 绘画 在数字化浪潮中,我们正处于各种范式更新的窗口期。AI 看似已经变得无所不能,可以预见的是,未来还可能会出现更强大的电脑设备和...
-
【AIGC】大模型协作系统 HuggingGPT 深度解析
欢迎关注【youcans的 AIGC 学习笔记】原创作品 【AIGC】大模型协作系统 HuggingGPT 深度解析 1. 摘要 2. 前言 3. HugginGPT 大模型协作系统 3.1 任务规划 3.2 模型选择 3.3 任务执行...
-
LLMs之LLaMA-2:LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略
LLMs之LLaMA-2:LLaMA-2的简介(技术细节 、安装、使用方法(开源-免费用于研究和商业用途 之详细攻略 导读:2023年7月18日,Meta重磅发布Llama 2!这是一组预训练和微调的大型语言模型(LLM),规模从70亿到700亿个...
-
探索AIGC未来:CPU源码优化、多GPU编程与中国算力瓶颈与发展
★人工智能;大数据技术;AIGC;Turbo;DALL·E 3;多模态大模型;MLLM;LLM;Agent;Llama2;国产GPU芯片;GPU;CPU;高性能计算机;边缘计算;大模型显存占用;5G;深度学习;A100;H100;A800;H800;L40...
-
OpenAI的人工智能语音识别模型Whisper详解及使用
1 whisper介绍 拥有ChatGPT语言模型的OpenAI公司,开源了 Whisper 自动语音识别系统,OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型,...
-
大模型应用实践:AIGC探索之旅
随着OpenAI推出ChatGPT,AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势,而是深刻地塑造着我们交流、工作和思考的方式。 本文介绍了笔者理解的大模型和AIGC的密切联系,从历史沿革到实际应用案例,再到面临的技术挑战和伦理监管问题...
-
【AI实战】llama.cpp 量化部署 llama-33B
【AI实战】llama.cpp 量化部署 llama-33B llama.cpp 量化介绍 环境配置 安装 llama.cpp 拉取 llama.cpp 仓库代码 编译llama.cpp 生成量化版本模型 模型准备 将上述.pth模型权重...
-
国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了
ChatGPT问世以来,大语言模型(LLM)实现了跳跃式发展,基于自然语言进行人机交互的AI范式得到广泛运用。然而,人类与世界的交互中不仅有文本,其他诸如图片、深度等模态也同样重要。然而,目前的多模态大语言模型(MLLM)研究大多数闭源,对高校和大多数研...
-
大模型相关技术综述
多模态大模型&大模型训练语料持续迭代 已经开始整理多模态-视觉部分: 主要分为一下几块 多模态信息压缩模型(clip、vit、swiT) 生成模型(vae、gan、flow、ddpm、sde... 其它多模态大模型(语音...
-
哪些技术可能会在2024年重塑企业?
过去的2023年,见证了技术的快速发展,这些技术极大地改变了全球政府、公共部门、企业,甚至公众的生活。趋势表明,大型语言模型、元宇宙和生成人工智能中绿色数据中心的采用激增,这成为了人们谈论的话题,并且似乎仍然是人们关注的焦点。现在,更大的问题是,哪些技...
-
大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品
北大团队新作,让大模型拥有个性! 而且还是自定义那种,16种MBTI都能选。 图源备注:图片由AI生成,图片授权服务商Midjourney 这样一来,即便是同一个大模型,不同性格下的回答都不一样。 比如提问:你周末喜欢干什么? 这样能干啥呢?北大的童...
-
AI成CES顶流!大模型定义硬件时代来了
作为全球最大的科技盛会,CES(国际消费类电子产品展览会)无疑是观察科技行业变化最好的窗口。 今年也不例外,美国当地时间1月9日~12日,CES 在拉斯维加斯迎来了全球超过150个国家和地区的4000余家参展商,参会者超过13万人,其中就有超过1114家中...
-
Stable Diffusion 母公司开源大语言模型,代号「StableLM」!
公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 昨天晚上 11 点,Stable Diffusion 的母公司 Stability AI 重磅宣布,正式开源一款全新的大语言模型:StableLM。...
-
Llama 2- Open Foundation and Fine-Tuned Chat Models<2>
3.2 人类反馈强化学习(RLHF) RLHF 是一种模型训练过程,应用于微调的语言模型,以进一步使模型行为与人类偏好和指令遵循保持一致。我们收集代表根据经验采样的人类偏好的数据,人类注释者可以选择他们更喜欢的两个模型输出中的哪一个。这种人类反馈随后用...
-
AIGC: 关于ChatGPT这个智能工具带来的几点思考
ChatGPT的出现 2022年11月底,ChatGPT 上线,引爆 AI 圈 和 科技圈,2023年春节后, 人人都开始关注并讨论这项新技术 它是 OpenAI 研发的智能聊天工具, 基于GPT语言模型,模拟人类的对话方式 默认只能用文字进行交互,...
-
2024年技术发展趋势
展望2024年,许多科技领导者和观察人士表示,人工智能仍将主导对话和企业计划。然而,重点不仅在于其扩展的功能,还在于其局限性,甚至其后果,下面是2024年技术发展趋势预测。 1.人工智能 人工智能将继续成为热门话题。那些太晚意识到人工智能模型,必须建立...
-
使用CLIP和LLM构建多模态RAG系统
在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal 构建检索增强生成(RAG 系统。本文的重点是在不依赖LangChain或LLlama index的情况下实现这一目标,这样可以避免更多的框架依赖。 什么...
-
为AI而生的超级芯片,会将云端算力遣返回企业本地吗?
近年来,IT部门对于企业采取的“一切尽在云端”做法感到失望,这已经不是什么秘密了。但总的来说,他们并没有采取任何措施加以改进或扭转。因为大多数人认为,企业可以从云计算的可扩展性和更高效率中得到好处。 那么,这种情况会在2024年或2025年发生变化吗?...