-
【送书福利-第二十八期】《AIGC:让生成式AI成为自己的外脑》
? 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号:程序员洲洲。 ? 本文专栏:本文收录于洲洲的《送书福利》系列专栏,该专栏福利多多,只需...
-
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索
OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波! 路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索: 内部名为Q (发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。 Q*正是由这场风暴的中...
-
“大模型本质就是两个文件!”特斯拉前AI总监爆火LLM科普,时长1小时,面向普通大众
特斯拉前AI总监Andrej Karpathy的新教程火了。 这次,他专门面向普通大众做了一个关于大语言模型的科普视频。 时长1小时,全部为“非技术介绍”,涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战,涉及的知识全部截止到本月(非常新)。...
-
这项AI研究引入 Atom:一种低位量化技术,可实现高效、准确LLM)服务
大型语言模型(LLM)是人工智能领域最新的引入,已经席卷全球。这些模型以其令人难以置信的能力,被人们广泛使用,无论是研究人员、科学家还是学生。凭借其仿人潜力回答问题、生成内容、概括文本、完成代码等方面,这些模型已经走过了很长的路程。 LLM 在情感分析、智...
-
研究人员开发自动识别古代楔形文字片的AI软件
一项由马丁·路德大学哈勒-维滕贝格(MLU)、约翰内斯·古腾堡大学迈因茨分校和迈因茨应用科学大学团队开发的新型人工智能软件如今能够解读难以辨认的楔形文字。与以往依赖照片的方法不同,该AI系统利用楔形文字片的3D模型,传递的结果比先前的方法更加可靠。这使得能...
-
清华大学提出全新加速训练大模型方法SoT
近日,微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought(SoT)”的全新人工智能方法,旨在解决大型语言模型(LLMs 生成速度较慢的问题。 尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响,但其处理速度的...
-
OpenAI宫斗没有赢家
发生在全球最顶级的人工智能公司OpenAI的一场宫斗闹剧,演变为一场“集体自杀”,最后似乎又复活了,CEO阿尔特曼回归,只是董事会发生了改组。 然而引发这场闹剧背后的根源,人工智能研究的公益性与商业性冲突,仍然存在。 这场闹剧,没有谁是赢家。OpenAI风...
-
人工智能对人类的威胁?Sam Altman 退出 OpenAI 的原因仍然不明
OpenAI 联合创始人 Sam Altman 凯旋回归 OpenAI,但关于他当初为何被这家人工智能初创公司解雇的问题仍然挥之不去。人们关注的焦点是,在人工智能技术安全问题上的分歧是否导致了事态的发展。 OpenAI 的前任董事会成员没有公开透露他们上...
-
分享一个国内可用的AIGC网站,免费无限制,支持AI绘画
背景 AIGC作为一种基于人工智能技术的自然语言处理工具,近期的热度直接沸腾?。 作为一个AI爱好者,翻遍了各大基于AIGC的网站,终于找到一个免费!免登陆!手机电脑通用!国内可直接对话的AIGC,也有各种提供工作效率的工具供大家使用。 产品名称...
-
AI 绘画Stable Diffusion 研究(十七)SD lora 详解(上)
大家好,我是风雨无阻。本期内容: Lora的原理是什么? Lora如何下载安装? Lora如何使用? 大家还记得 AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解 这篇文章中,曾简单介绍了Lora的安装和使用吗 ?...
-
2023年微软开源八个人工智能项目
作者 | Tsamia Ansari 策划 | 言征 自2001年软件巨头微软前首席执行官史蒂夫·鲍尔默对开源(尤其是Linux)发表尖刻言论以来,微软正在开源方面取得了长足的进步。继ChatGPT于去年年底发布了后,微软的整个2023年,大多数技术...
-
智慧城市的发展:废物管理和空气质量监测
通过废物管理和空气质量监测方面的智慧城市进步,探索城市生活的未来。 “智慧城市”的概念已经成为城市规划和发展的一种创新方法,体现了一系列旨在提高生活质量、服务效率和可持续性的战略。这些战略包括智能废物管理和空气质量监测系统,它们采用先进技术优化资源利用...
-
OpenAI 秘密研究 Q*,离 AGI 又近了一步
Q* 近期报道揭示了OpenAI正在进行的秘密研究项目,名为 Q*,这被认为是迈向通用人工智能(AGI)的一项重大进步。该项目由OpenAI的首席科学家Ilya Sutskevar以及其他杰出的研究人员,如Jakub Pachocki和Szymon Sid...
-
奥特曼不是第一次被开除!离职YC系“被创始人要求离开”
钮祜禄·奥特曼,竟然不是第一次被“扫地出门”??! 没想到,OpenAI闹剧刚稍微消停了一点,“前传”马上来了。 《华盛顿邮报》从知情人士处获悉,奥特曼卸任Y Combinator总裁,并非此前说的“辞职”,而是被开除。 YC创始人保罗·格雷厄姆(Pa...
-
提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点
【新智元导读】最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这个结果表明,统一L...
-
GPT-4成学术造假“神器”,伪造数据又快又合理,Nature请统计学专家“断案”
学术造假有了GPT-4,变得更容易了。 这两天,一篇刊登在Nature上的新闻表示,GPT-4生成的造假数据集,第一眼还真不一定看得出来。 除非请来业内专家仔细对数据集进行评估,才能发现个中细节的不合理性。 这个新闻的来源是一篇发表在JAMA Ophth...
-
OpenAI新模型曝重大飞跃:AGI雏形或威胁人类,也成Altman被解雇导火索!
Sam Alman被解雇,又曝出最新内幕! 据路透社报道,就在他被解雇的前四天,OpenAI内部的研究员曾向董事会发了一封警告信,称发现了一个可能威胁人类的强大人工智能。 知情人士表示,这封此前从未报道过的信,也是董事会最终罢免Altman的导火索之一。...
-
在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本
您是否厌倦了手动转录数小时的录音?您想节省时间并提高工作效率吗?然后,您会很高兴听到 OpenAI 用于语音到文本转换的新 Whisper API!借助这项尖端的 AI 技术,您现在可以在 Python 程序中轻松地将音频文件转换为文本。让我们在下面...
-
消息称阿尔特曼遭罢免原因在于 OpenAI 认为 Q* 技术突破将威胁人类
IT之家 11 月 23 日消息,随着萨姆・阿尔特曼(Sam Altman)重返 OpenAI 担任首席执行官,这场闹得沸沸扬扬的“OpenAI 宫斗剧”似乎也终于要落下帷幕,现在开始有人深挖这次事件的一些细节。 路透社援引两位知情人士的话透露,在 Op...
-
聊一聊高精地图的数据问题,无图感知还有哪些坑要踩?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在自动驾驶领域,高精地图在定位、规划和避碰等方面发挥着至关重要的作用,实现行车安全和高质量路线预测。然而高精地图的构建都是昂贵、复杂的,而且专业性很强,无论是在硬件组成还是软件及其所使用的算法方面。...
-
stable diffusion基础
整合包下载:秋叶大佬 【AI绘画·8月最新】Stable Diffusion整合包v4.2发布! 参照:基础04】目前全网最贴心的Lora基础知识教程! VAE 作用:滤镜+微调 VAE下载地址:C站(https://civitai.com/mode...
-
南开大学与字节跳动研究人员推出开源AI工具ChatAnything:用文本描述生成虚拟角色
南开大学与字节跳动研究人员合作推出了一项引人注目的研究,发布了一种名为ChatAnything的全新AI框架。该框架专注于通过在线方式生成基于大型语言模型(LLM)的角色的拟人化形象,从而创造具有定制视觉外观、个性和语调的人物。 简答的说,ChatAnyt...
-
AI视野:ChatGPT语音旁白功能免费开放;文心一言率先实现收费;Claude2.1长下文长度扩展至200K;拼多多成立大模型团队
???AI新鲜事 ChatGPT语音旁白功能现已向所有免费用户开放 OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放,用户只需下载应用程序,点击耳机图标即可进行语音对话,此功能于今年9月推出,最初仅面向Plus和Enterp...
-
马斯克爆料奥特曼七宗罪! Altman重启谈判,ChatGPT大崩溃
ChatGPT又双叒宕机了。 继半个月前大规模宕机之后,ChatGPT这次因访问暴涨,再一次下线。 图片 推特上,网友一片哀嚎。尤其是正在准备期末的大学生们,纷纷发帖吐槽「这学没法上了」! 图片 OpenAI这波大动荡,已经搞得全公司上下人心惶惶,让人不...
-
DIY4U项目:使用AI定制个人肥皂或洗发水等护理产品
近日,研究人员利用人工智能技术开发了一种定制个人护理产品的新方法。他们研发了一台基于AI技术的机器,可以根据个人需求定制肥皂、洗发水等护理产品。 消费品市场上充斥着各种肥皂和洗涤剂,但通过定制这些产品,可以满足消费者日益苛刻的需求,并同时使它们更加环保。S...
-
Nvidia和Genentech合作利用人工智能加速药物发现
Nvidia正在与生物技术巨头基因泰克公司(Genentech)合作,双方计划利用多年时间把最先进的人工智能功能(包括生成式AI)用于加速药物发现研究。 Nvidia表示,希望通过将其生成式AI模型和算法转变为“下一代AI平台”来加强Genentech...
-
10分钟搭建Stable Diffusion
前言 人工智能生成内容(Artificial Intelligence Generated Content,简称 AIGC)是当下最火的概念之一。AIGC 被认为是继专业生成内容(Professional Generated Content, PGC)和...
-
文心一言发布,你怎么看?chatGPT
百度全新一代知识增强大语言模型“文心一言”于2021年3月16日正式发布,作为一款自然语言处理技术,它引起了广泛的关注和讨论。 首先,文心一言是一款具有重大意义的自然语言处理技术。在人工智能领域,自然语言处理技术一直是一个难以攻克的难题。而文心一言作为一...
-
Anthropic CEO拒绝了OpenAI董事会提出的合并要约
11月21日消息,据外媒报道,知情人士称,FT X支持的人工智能公司Anthropic的CEO兼联合创始人达里奥·阿莫代(Dario Amodei)拒绝了OpenAI董事会提出的合并要约。 该合并要约是在OpenAI上周五宣布解雇CEO萨姆·阿尔特曼(Sa...
-
UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的最先进 AI 方法
LLM,如 ChatGPT,可以轻松地产生各种流利的文本,但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉,这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性...
-
谷歌 Deepmind 推出 Lyria AI 音频模型,可生成带有乐器和人声的音乐
11 月 21 日消息,Deepmind 日前推出了一款名为 Lyria 的音频模型,可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作,整合 Lyria 模型开发了音乐创作工具 Dream Track,声称可令...
-
研究人员使用特殊图像“毒害”人工智能
DALL-E、Midjourney和Stable Diffusion等人工智能生成艺术工具的兴起引发了激烈的辩论和争议。这些系统可以通过在互联网上收集的大量数据集上进行训练,简单地根据文本提示创建真实感图像和艺术。然而,这引发了人们对侵犯版权、滥用艺术家...
-
开源社区有望成为OpenAI人事震动的最大赢家
美国当地时间11月20日上午,微软出人意料地聘请了OpenAI前CEO奥特曼和OpenAI总裁格雷格·布罗克曼,这一战略决定似乎是微软试图尽其所能摆平由OpenAI的董事会解雇奥特曼造成的混乱局面。 OpenAI政变的剧情一直在发展,几名研究人员已经辞...
-
DeepMind推出OPRO技术,可优化ChatGPT提示
在最新的AI研究报道中,Google DeepMind推出了一项名为“优化通过提示(OPRO)”的技术,将大型语言模型(LLM 作为其自身提示的优化器。该方法旨在通过自然语言描述问题,指导LLM生成和改进解决方案,从而提高提示性能。 OPRO的工作方式相对...
-
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
人工智能(AI)在医学影像诊断方面的应用已经有了长足的进步。然而,在未经严格测试的情况下,医生往往难以采信人工智能的诊断结果。对于他们来说,理解人工智能根据医学影像给出的判别,需要增加额外的认知成本。 为了增强医生对辅助医疗的人工智能之间的信任,让 AI...
-
微软230页报告,像素级评估GPT-4前沿科研能力:潜力无限速速上车!
LLM作为研究工具,能否帮助科学研究带来新的突破? 今天微软AI4Science Research抛出一篇230页的重磅论文,告诉所有的科研人员: LLM(GPT-4)太强了,赶快想办法用起来! 论文地址:https://arxiv.org/abs/2...
-
Grounding dino + segment anything + stable diffusion 实现图片编辑
目录 总体介绍 总体流程 模块介绍 目标检测: grounding dino 目标分割:Segment Anything Model (SAM 整体思路 模型结构: 数据引擎 图片绘制 集成 样例 其他问题 附录 总体介绍...
-
GPT-4不会图形推理?“放水”后准确率依然只有33%
GPT-4的图形推理能力,竟然连人类的一半都不到? 美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。 而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。 △虚线表示16项任务的平均表现 这项实验结果发表后,迅速在...
-
“ChatGPT之父被开”事件大结局 奥特曼加入微软领导新团队
上周末,OpenAI的董事会发布了一则地震级的官方公告,宣布奥特曼将辞去首席执行官一职,并离开董事会,由技术主管米拉穆拉蒂接任,立即生效。董事会在博文中指出,经过审议审查过程,他们认为奥特曼在与董事会沟通中缺乏始终如一的坦诚,阻碍了董事会履行职责的能力,因...
-
纳德拉官宣OpenAI前CEO Altman和前总裁Brockman将加入微软
11月20日消息,据外媒报道,当地时间周一,微软CEO萨蒂亚·纳德拉(Satya Nadella)在社交平台X上宣布,OpenAI前CEO萨姆·阿尔特曼(Sam Altman 和前总裁格雷格・布罗克曼(Greg Brockman 将加入微软,领导一个新的高...
-
研究证实,最好的 ChatGPT 提示是高度情绪化的
一组研究人员发现,充满情感的LLM输入始终会产生更有用的反应。 对不同大型语言模型响应输入方式的新研究表明,确保您的ChatGPT 提示足够情绪化将帮助您从聊天机器人中提取最高质量的响应。 这些发现提出了一个问题,即ChatGPT是否已经发展成为通用人...
-
OpenAI创始人Sam Altman被解雇后的24小时
ChatGPT背后的公司OpenAI周五解雇了其首席执行官兼创始人Sam Altman,他惊人的离职给新兴的人工智能行业带来了冲击波。 该公司在一份声明中表示,内部调查发现,阿尔特曼并不总是对董事会诚实。 该公司在声明中表示:“阿尔特曼先生的离职是在董...
-
DiagrammerGPT:GPT-4主导的颠覆性双层文生图表模型
近期,北卡罗来纳大学提出了一项重大技术突破,通过将GPT-4充当“规划师”和“审计师”,构建了DiagrammerGPT框架,实现了文本描述生成科学图表的布局规划。该框架利用GPT-4的强大自然语言处理能力指导图表布局生成,创新性地设计了闭环反馈机制,通过...
-
GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了
GPT-4V 的发布让许多计算机视觉(CV)应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。 最近,一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...
-
马斯克呼吁OpenAI公布CEO阿尔特曼被解雇原因
11月20日消息,据外媒报道,在OpenAI董事会于上周五宣布解雇其CEO萨姆·阿尔特曼(Sam Altman)后,特斯拉CEO埃隆・马斯克(Elon Musk)呼吁OpenAI公布解雇阿尔特曼的原因。 据悉,OpenAI由马斯克、阿尔特曼、PayPal联...
-
Altman王者归来!强势要求解散董事会,OpenAI终极宫斗一触即发
从被扫地出门到王者回归,乔布斯用了12年,而Sam Altman,仅仅用了两天。 现在,Altman已经以胜利者的姿态重返OpenAI探讨自己的去留问题,并且对董事会提出了新的要求—— 「更换现有的董事会成员,并且得到证明自己并无过错的声明。」 简单来说...
-
GPT-4充当“规划师、审计师”,颠覆性双层文生图表模型
DALL-E3、Midjourney、Stable Diffusion等模型展现出了强大的创造能力,通过文本便能生成素描、朋克、3D、二次元等多种类型的高质量图片,但在生成科学图表(柱状、直方、箱线、树状等)方面却略显不足。 这是因为模型在生成图表时会遗漏...
-
谷歌为什么输给了OpenAI?科技公司创始人兼谷歌前员工带你一探究竟
在当今的人工智能浪潮中,OpenAI这样的新兴公司引领了革命。 ——而GPT的一些关键部分:Transformer、强化学习(AlphaGo ) 和 多模态(Flamingo)却都是由Google发明的。 那么为什么,作为科技领域巨无霸的Google,却...
-
Meta 介绍 AI 图像编辑工具 Emu Edit / Video:使用 1000 万个数据集训练,号称远超竞品
IT之家 11 月 20 日消息,Meta 昨日宣布为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具,分别是“Emu Edit”和“Emu Video”,适用领域包括照片和视频,目前 Meta 公布了这两项 AI 工具的更...
-
效果超越SDXL!港中大博士生推出超真实人像合成工具,训练用了3.4亿张图
为了让AI画出的人更加逼真,港中大博士生用了3.4亿张图像专门训练画人。 人物的表情、姿态,环境的空间关系、光线都能合理布局,可谓立体感十足。 就连爆火的SDXL也不是它的对手,话不多说,直接上图! 这个模型的名字叫HyperHuman,主打的就是一个...