???AI应用
爱奇艺推出AI搜索 将生成式AI技术应用于剧情搜索等场景
爱奇艺升级AI搜索,区别于传统搜索第一步只能搜到片名,升级后的爱奇艺AI搜索主打让观众在搜索环节便能一键直达心仪内容。
WPS AI 宣布接入 WPS Mac 版 提供内容生成等功能
WPS宣布,Mac版的WPS已经接入了WPS AI,这将带来内容生成、内容修改和辅助阅读等功能。
苹果计划明年推出生成式AI功能和新版Siri
苹果正计划推出一系列采用生成式人工智能(AI)技术的功能,其中包括新版本的 Siri,预计明年发布。新功能包括重新设计的「Siri」与「信息」应用程序之间的互动,使用户更有效地处理复杂问题和自动完成句子。
????大模型动态
DeepMind 大模型无法自我纠正推理,除非预设真值标签
DeepMind 的研究人员发现,大型语言模型(LLM)在推理任务中无法通过自我纠正获得更好的回答,除非数据集中预设了真值标签。这一发现揭示了 LLM 在推理能力上的重大缺陷。
天猫精灵全面上线 “精灵大模型”
天猫精灵“精灵大模型”现已全面上线,带来四大升级技能,包括开放域对话和AIGC创作功能的优化、解决就近唤醒问题以及支持音色切换。
中科院国家天文台开源天文大模型 StarWhisper
星语 StarWhisper 是一个基于天文大模型 StarGLM 开发的开源项目,旨在提升大模型在天文通用知识和多模态任务上的能力,为未来可部署于望远镜阵列的科学具身智能 —— 司天大脑打下基础。
项目地址:https://github.com/Yu-Yang-Li/StarWhisper
???AI新鲜事
用GPT-4训练机器人,英伟达最新Agent开源:任务越复杂越拿手
英伟达最新AI AgentEureka ,用GPT-4生成奖励函数,结果教会机器人完成了三十多个复杂任务。比如,快速转个笔,打开抽屉和柜子、抛球和接球。
AI技术漏洞!OpenAI的DALL-E3易受越狱攻击 生成儿童吸烟照片
OpenAI的DALL-E3是一种强大的图像生成AI技术,但最新的事件表明,它并非没有漏洞。一位名为Peter Gostev的LinkedIn用户发现了一种越狱技巧,成功生成了一组令人震惊的图像,显示儿童正在吸烟。这一事件引发了对AI系统安全性和道德的担忧。
谷歌Pixel8的换脸照片工具引发人工智能操纵争论
谷歌最新智能手机Pixel8和Pixel8Pro搭载人工智能功能,可帮助用户修改照片中的面部表情。这一创新引发了科技界对AI操纵和伪造的担忧。谷歌官方辩称这项技术并不“伪造”,而是基于真实时刻创建理想效果。部分专家认为重点是这项AI以创造美好图像为目的,而非复制现实。
HeyGen太牛了!不但让霉霉说地道中文 而且还能卡点
这两天,美国女歌星泰勒・斯威夫特(霉霉)一则说中文的短视频在各社交平台火了起来。在视频里,霉霉操着一口流利、地道的中文,神情自若,几乎没有早期译制片女主角的那种腔调,口型也能对得上。这么看来,AI 配音真的可以「以假乱真、真假难辨」。
仅5个字符的新绘图语言火了,ChatGPT都学会了
只用五个字符,就能完成一幅像素画的绘制了。这是一种新的绘图语言,一共支持8种颜色,画幅可达256*256。它包含了“CFR[]”这五个符号,因此名字也就叫CFR[]了,主打的就是一个直观。而且CFR[]免费开源,无需部署安装,在线就能体验。
传送门:
https://susam.net/cfr.html
GitHub项目页:
https://github.com/susam/cfr
新型 AI 算法能在90分钟内诊断脑肿瘤
荷兰研究人员开发了一种算法,叫做Sturgeon,可以在90分钟内识别出脑瘤的类型。Sturgeon算法依赖于一种新的技术,叫做“纳米孔测序”,可以实时地读出DNA样本中的碱基序列。
韩国SK与德国电信合作开发AI大语言模型
韩国电信巨头SK telecom宣布与全球电信公司德国电信合作,共同开发旨在实现AI视觉的大语言模型(LLM)。这一合作计划于2023年第一季度发布面向电信领域的专业化LLM。
????聚焦开发者
全新视觉提示方法 SoM 让 GPT-4V 看得更准、分的更细
研究人员推出了一种新的视觉提示方法 Set-of-Mark(SoM),它可以让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。GPT-4V 是一种基于 GPT-4的多模态模型,可以同时处理文本和图像,并生成多种类型的输出。
论文地址:https://arxiv.org/pdf/2310.11441.pdf
论文主页:https://som-gpt4v.github.io/
港大团队开源 Agent 框架 OpenAgents 支持200+ 插件
OpenAgents是一个开放平台,用于在日常生活中使用和托管语言智能体。该平台旨在促进构建概念验证的语言智能体,同时考虑非专业用户对智能体的访问和应用层面的设计。
项目地址:https://github.com/xlang-ai/OpenAgents
OpenCSG推出“传神”社区,支持大模型应用开发和落地
OpenCSG是一家专注于大语言模型的AI公司,近日在上海发布了“传神”开放创新生态社区,旨在帮助用户快速构建和发布基于大模型的应用。该社区遵循开放中立的原则,同时关注行业应用场景和需求。1OpenCSG还发布了大模型研发和应用开发平台StarNet,以及OpenNova系列开源大模型。