- 
        一周 AIGC 丨马云回国首谈 ChatGPT,AIGC 用于旅游宣传片图片来源:由无界AI生成 今天,在海外“流浪”近 1 年的马云回国的消息刷屏,被众多媒体解读为是对中国民营企业的一个重大的标志性事件。眼光一向超前的马云自然不会错过 ChatGPT 话题。他说:“ChatGPT 这一类技术已经对教育带... 
- 
        中文版LLaMA:Chinese-LLaMA-AlpacaGitHub:GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 以ChatGPT、GP... 
- 
        解锁大语言模型“黑匣子”自从大约10年前深度学习模型开始获得关注以来,人工智能的黑匣子问题就一直存在。但现在我们处于后ChatGPT时代,旧金山初创公司Watchful希望提高大型语言模型的透明度。 Watchful联合创始人兼首席执行官Shayan Mohanty说:“当人... 
- 
        PubMedBERT:生物医学自然语言处理领域的特定预训练模型今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta,这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中,大语言模型并不一定就是最优的解决... 
- 
        疑似威胁人类?OpenAI神秘Q*项目更多信息曝光,马斯克、Lecun下场争论…夕小瑶科技说 原创 作者 | 王二狗大家好我是二狗 随着前天 OpenAI 官宣 Sam Altman 将回归,并继续担 CEO,OpenAI“宫斗事件”已经告一段落了。 然而,对于专业吃瓜的二狗来说,有一个核心问题还是没有搞明白: Sam Altman... 
- 
        文心一言和chatgpt目录 百度文心一言 新一代大语言模型、生成式 AI 产品文心一言,能做什么? 脚踏实地,仰望星空... 
- 
        LLMs之Code:大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等)及其评估LLMs之Code:大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等 及其评估基准(包括数据集 、案例应用之详细攻略 目录 大模... 
- 
        AI生成内容(AIGC):概念、实现与未来趋势一、AIGC的基本概念 AI生成内容(AIGC),是指运用人工智能技术,尤其是深度学习技术,创建各类数字内容的新型内容创作模式。AIGC继承了专业生成内容(PGC)的高质量特点,再结合用户生成内容(UGC)的分布式、互动的特点,打造了全新的数字内容生成与... 
- 
        文心一言和讯飞星火全面对比测试:(一)语言理解能力目录 01 前言 02 测试内容设计 03 复杂语义测试 04 文章的情绪识别 05 文章的摘要总结 06 文章要素提取 07 总结 01 前言 文心一言和讯飞星火是目前国内开展正式公测的两个大语言模型。很多公司... 
- 
        与AIGC的快乐游戏: Prompt提示词的重要性你好,亲爱的读者们!我是你们的老朋友小W,致力于探索和分享一切有关人工智能的话题。今天,我想带你走进一个全新的领域——玩转AIGC(Artificial Intelligence Generated Content),并告诉你一个重要的秘密:Prompt提... 
- 
        三分钟快速构建大语言模型AI知识库FastGPT FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景! 知识库核心流程图 图片 图片来源:https://doc.fa... 
- 
        【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮,也有很多相关工作不断涌现。最近Meta全新发布了Llama-2,效果更上一层楼。而且最重要的是模型可以相对随意分发了,不像一代一样,meta不让开发者发布基于llama模型训... 
- 
        2 天:我用文字 AI-ChatGPT 写了绘画 AI-Stable Diffusion 跨平台绘画应用文本 AI - ChatGPT 和绘画 AI - Stable Diffusion,平地惊雷,突然进入寻常百姓家。 如果时间可以快进,未来的人们对于我们这段时光的历史评价,大概会说: 当时的人们在短时间连续经历了这几种情感。从不信,去试试看;到远超预期... 
- 
        OpenAI神秘Q*毁灭人类?爆火「Q*假说」竟牵出世界模型,全网AI大佬长文热议Q* 【新智元导读】传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文,猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI,已是临门一脚了? Ope... 
- 
        被“薄纱”的文心一言,真的一无是处?大家好,我是王有志,欢迎和我聊技术,聊漂泊在外的生活。本文单纯讨论文心一言,不涉及其母公司百度的所作所为 3月16日百度交卷了,正式推出了自己的知识增强大语言模型文心一言。 作为全球第二家,中国第一家正式推出的大语言模型,文心一言被很多人寄予厚望,期... 
- 
        谷歌推出免费AI编程神器Colab,欲将Copilot拉下神坛在如今的AI编码工具领域,微软旗下的Github Copilot可以算得上是一家独大,而作为老对手的谷歌显然并不愿屈服于此。 近日,谷歌通过其官网高调发文宣布,将为研发工具Google Colaboratory(Colab)加入全新的AI编码功能,包括... 
- 
        AIGC数据处理与存储解决方案针对在AIGC的场景下,如何解决在AIGC训练过程中数据的存储和数据处理的问题,杨冠军从三个方面进行介绍与解读: 一是AIGC对存储提的新需求; 二是介绍腾讯云可以给用户提供的整体存储解决方案; ... 
- 
        数字人系列四:Motionverse 接入chatgpt、文心一言等国内外大语言模型1. 下载插件:motionverse官网地址:概述 · Motionverse 接口文档 (deepscience.cn 2. 按照官方文档新建Unity工程:对接说明 · Motionverse 接口文档 (deepscience.cn ... 
- 
        通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测引言 “克隆 dev 环境到 test 环境,等所有服务运行正常之后,把访问地址告诉我”,“检查所有项目,告诉我有哪些服务不正常,给出异常原因和修复建议”,在过去的工程师生涯中,也曾幻想过能够通过这样的自然语言指令来完成运维任务,如今 AI 助手 Ap... 
- 
        LeCun发文质疑LLM推理能力 大模型涌现离不开上下文学习近期,LeCun在推特上引发了关于大语言模型(LLM)推理能力的讨论,强调LLM缺乏真正的规划推理能力,其涌现能力实际上是上下文学习的结果。研究通过多个实验验证LLM在复杂规划任务上表现不佳,强调其能力受限于任务复杂度。 研究团队在GPT-4上进行的实验显... 
- 
        视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效最近,除了大语言模型继续持续刷屏,视频生成技术也取得了重大进展,多家公司相继发布了新模型。 首先,作为最早探索视频生成领域的领头羊之一,Runway 升级了其 Gen-2 模型,带来了电影级别的高清晰度,令人瞩目,并称视频生成的一致性得到了重大改进。 但... 
- 
        AI加速“科技权势”集中,巨头垄断AI会造成严重后果吗?大家有没有发现,AI技术似乎相当集中,科技巨头占尽优势。基于这一现实,许多科技高管纷纷发声预警,他们认为:科技巨头本来已经拥有相当大的权势,到了AI时代权势将会更大。 去年OpenAI推出ChatGPT,它可以根据提示给出答案,瞬间引爆了生成式AI大变革... 
- 
        AI风暴 :文心一言 VS GPT-4?wei_shuo的个人主页 ?wei_shuo的学习社区 ?Hello World ! 文心一言 VS GPT-4 文心一言:知识增强大语言模型百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问... 
- 
        “大模型本质就是两个文件!”特斯拉前AI总监爆火LLM科普,时长1小时,面向普通大众特斯拉前AI总监Andrej Karpathy的新教程火了。 这次,他专门面向普通大众做了一个关于大语言模型的科普视频。 时长1小时,全部为“非技术介绍”,涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战,涉及的知识全部截止到本月(非常新)。... 
- 
        牛津大学AI研究员发出警告:大语言模型对科学真相构成风险在最新的一篇研究中,牛津大学互联网研究所的人工智能研究员发出了对大语言模型(LLMs)对科学真相构成威胁的警告。由Brent Mittelstadt、Chris Russell和Sandra Wachter等研究员在《自然人类行为》期刊上发表的论文中,他们... 
- 
        淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并保持和LLaMA社区的兼容性。测试显示,在32卡训练上,相比HuggingFace上直接获得的... 
- 
        AI 绘画Stable Diffusion 研究(十七)SD lora 详解(上)大家好,我是风雨无阻。本期内容: Lora的原理是什么? Lora如何下载安装? Lora如何使用? 大家还记得 AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解 这篇文章中,曾简单介绍了Lora的安装和使用吗 ?... 
- 
        AIGC生成式代码——Code Llama 简介、部署、测试、应用、本地化导读: 本文介绍了CodeLlama的简介、本地化部署、测试和应用实战方案,帮助学习大语言模型的同学们更好地应用CodeLlama。我们详细讲解了如何将CodeLlama部署到实际应用场景中,并通过实例演示了如何使用CodeLlam... 
- 
        Real AI发布欧洲首个人本主义开源大语言模型项目HOMINIS在贝尔格莱德于2023年11月23日举办的数据科学大会上,Real AI宣布成功中标ISCRA项目。Real AI将建设欧洲首个基于LEONARDO超级计算机的人本主义大语言模型(LLM)。 LEONARDO超级计算机位于博洛尼亚的CINECA数据中心,是... 
- 
        OpenAI的危机已消除,人工智能的未来何去何从?OpenAI是一个致力于创造和推广人工智能(AI)的非营利组织,它的愿景是建立一个能够与人类智能相匹配或超越的通用人工智能(AGI),并确保它对人类和自然有益。然而近期,OpenAI的内部发生了一场震惊世界的政变,其首席执行官Sam Altman被董事会... 
- 
        提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点【新智元导读】最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这个结果表明,统一L... 
- 
        Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic TasksGoat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks Introduction Method 语言模型 数学问题学习能力 COT 实验 参考 Introdu... 
- 
        微软ChatGPT的投资在AI上赚的是名声大起,又爆新品微软Copilot微软宣布向ChatGPT开发者OpenAI追加投资数十亿美元,这也是人工智能领域史上规模最大的一笔投资。 微软公司周一公告称,这将是一项“多年、数十亿美元”的投资协议,下一阶段将专注于将各类工具推向市场。微软CEO纳德拉在公告中表示,“各行各业的... 
- 
        stable diffusion基础整合包下载:秋叶大佬 【AI绘画·8月最新】Stable Diffusion整合包v4.2发布! 参照:基础04】目前全网最贴心的Lora基础知识教程! VAE 作用:滤镜+微调 VAE下载地址:C站(https://civitai.com/mode... 
- 
        AI视野:ChatGPT语音旁白功能免费开放;文心一言率先实现收费;Claude2.1长下文长度扩展至200K;拼多多成立大模型团队???AI新鲜事 ChatGPT语音旁白功能现已向所有免费用户开放 OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放,用户只需下载应用程序,点击耳机图标即可进行语音对话,此功能于今年9月推出,最初仅面向Plus和Enterp... 
- 
        用深度催眠诱导LLM「越狱」,香港浸会大学初探可信大语言模型尽管大语言模型 LLM (Large Language Model 在各种应用中取得了巨大成功,但它也容易受到一些 Prompt 的诱导,从而越过模型内置的安全防护提供一些危险 / 违法内容,即 Jailbreak。深入理解这类 Jailbreak 的... 
- 
        iOS 18将成第一代AI原生系统?苹果真加急把AI装进系统,迎来史上最大更新据知名科技记者Mark Gurman报道,苹果暂停了iOS 18新功能的开发,以专注于修复错误。 暂停功能开发对于苹果来说是不太寻常的事件,尽管时间只有一周。这也许表明了苹果对于新的iPhone系统的重视,以及对于未来的野心。 Gurman称,苹果内部将... 
- 
        起底OpenAI“地震”中的焦点人物Ilya,他对AI到底有何看法?OpenAI CEO山姆·奥特曼(Sam Altman)上周五被解雇,不再领导公司。 投资者对这种安排多有不满,尝试让奥特曼回归,但失败了。OpenAI最大的投资者微软发布消息称,已经聘请奥特曼领导微软新成立的AI研发部门。 为什么会出现人事动荡?我们不... 
- 
        大模型微调踩坑记录 - 基于Alpaca-LLaMa+Lora前言 为了使用开放权重的LLM(大语言模型 ,基于自己的训练集,微调模型,会涉及到如下一些技术要点: 配置运行环境 下载、加载基础模型 收集语料、微调训练 检验训练效果 在实施过程中,遇到不少困难,因此写下这篇文档,做为记录。 环境配置... 
- 
        文心一言发布,你怎么看?chatGPT百度全新一代知识增强大语言模型“文心一言”于2021年3月16日正式发布,作为一款自然语言处理技术,它引起了广泛的关注和讨论。 首先,文心一言是一款具有重大意义的自然语言处理技术。在人工智能领域,自然语言处理技术一直是一个难以攻克的难题。而文心一言作为一... 
- 
        斯坦福用几百块钱训练的alpaca,体验一下基于llama的7b和13b模型,据说比gpt3.0还牛,结果怎样??你能信?好久没写代码了,上头了,强撸了! 1、自己买个GPU服务器(如果不训练,可以随便买个高内存的即可),有些网站很便宜,小时起租! 2、alpaca和模型下载地址:GitHub - antimatter15/alpaca.cpp: Locally run... 
- 
        联发科发布AI处理器天玑8300 Redmi K70E 将全球首发联发科在11月21日举行了天玑8300处理器的发布会。天玑8300采用了台积电第二代4nm 制程,搭载了4个 Cortex-A715性能核心和4个 Cortex-A510能效核心的八核 CPU,性能提升了20%,峰值功耗降低了30%。 在游戏体验方面,天玑... 
- 
        AI写作助手在计算机科技瞬息万变的时代,人工智能 (AI 已经成为了日常生活的一部分,尤其是在文本生成和自然语言处理方面。华丽的明珠之一就是OpenAI的GPT-4,一个能够体验多种写作情景的AI写作助手。本文将深入探讨GPT-4的特点,优势,局限性以及如何使用它,... 
- 
        大语言模型-中文chatGLM-LLAMA微调微调大语言模型-ChatGLM-Tuning大语言模型-微调chatglm6b大语言模型-中文chatGLM-LLAMA微调大语言模型-alpaca-lora 本地知识库大语言模型2-document ai解读大语言模型-DocumentSearch解... 
- 
        大语言模型之七- Llama-2单GPU微调SFT(T4 16G)模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener... 
- 
        AI「cosplay」关键在人设!复旦、人大等发布大五人格+MBTI测试:特质还原率达82.8%,拒绝OOC想和喜欢的动漫小说角色聊天?想要一个虚拟伴侣?想要自己的数字智能体? 随着大语言模型(Large Language Models, LLM)的发展,这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大... 
- 
        中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型(LLM)。该模型基于封神榜团队的 Ziya2-13B 模型构建,拥有130亿个参数,并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的... 
- 
        ChatGLM-LLaMA-chinese-insturct 学习记录(含LoRA的源码理解)ChatGLM-LLaMA-chinese-insturct 前言 一、实验记录 1.1 环境配置 1.2 代码理解 1.2.1 LoRA 1.4 实验结果 二、总结 前言 介绍:探索中文instruct数据在C... 
- 
        LLM - Model Load_in_8bit For LLaMA一.引言 LLM 量化是将大语言模型进行压缩和优化以减少其计算和存储需求的过程。 博主在使用 LLaMA-33B 时尝试使用量化加载模型,用传统 API 参数控制量化失败,改用其他依赖尝试成功。这里先铺下结论: ◆ Load_in_8bit ✔️... 
- 
        【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案 中...