当前位置:AIGC资讯 > AIGC > 正文

AI视野:OpenAI成全球第三最有价值初创公司;SDXL推精简版本;小米14将搭载WPS AI功能;Bing AI拒绝生成女性逼真图像

???AI应用

SDXL推精简版本SSD-1B 推理速度提升60%

Segmind Stable Diffusion1B(SSD-1B)是一款高效、高速的文本生成图像AI模型,为图像生成提供广泛可能性,它是稳定扩散XL的精简版本,体积减小50%,但速度提升60%。

《福布斯》推出新型人工智能搜索工具Adelaide 测试版

福布斯杂志发布了Adelaide,一款人工智能搜索工具,可根据读者提出的问题生成相关文章和答案,提高用户参与度和搜索创新应用。

AudioSep:可以从音频剪辑中仅分离出特定的声音

AudioSep是一款创新的AI模型,能够通过自然语言查询,精确从音频中分离特定声音,提供训练和微调功能、内存效率以及强大的分离性能。

???AI新鲜事

OpenAI估值飙升,成为全球第三最有价值初创公司

OpenAI的估值预计将达到800亿美元,使其成为全球第三最有价值的初创公司,仅次于TikTok的字节跳动和Elon Musk的SpaceX。

Bing AI图片生成器拒绝生成女性的逼真图像,称其“不安全”

微软的Bing AI图片生成器在生成逼真男性图像方面表现出色,但拒绝生成逼真女性图像,声称这不符合其内容政策,引发了性别相关问题的讨论。

小米14手机深度合作金山办公,搭载WPS AI功能

小米14手机宣布与金山办公深度合作,推出搭载WPS AI功能的专属版WPS,旨在提供更智能的移动办公体验。

OpenAI成立准备组以评估和防范人工智能带来的灾难性风险

OpenAI成立名为「准备组」的团队,由麻省理工学院的亚历山大·马德里领导,旨在评估、检测并预防人工智能模型可能导致的「灾难性风险」。

英特尔数据中心和人工智能业务收入38亿美元

英特尔公司在第三季度实现142亿美元的营收,数据中心和人工智能业务收入为38亿美元,尽管同比下降,但超过了市场预期。

微软必应聊天将非Edge浏览器的文本输入量提升至4000个

微软最近扩大了非Edge浏览器用户在必应聊天中的文本输入量,从2000个提高到4000个,但每个主题对话仍限制在5轮内。这可能会给一些用户带来不便,但微软考虑根据反馈和市场需求进一步增加对话轮次的限制。需要注意的是,历史记录和个性化答案仍仅在Edge浏览器中可用。

联合国成立39人人工智能国际治理咨询团队

联合国秘书长安东尼奥·古特雷斯成立39人咨询顾问团队,以解决人工智能国际治理问题,包括技术公司高管、政府官员和学者,该团队将发布初步和最终建议,加强国际合作。

机器人替身!远程机器人VRoxy可在VR中模仿你的动作

康奈尔大学和布朗大学的研究人员开发了名为VRoxy的远程机器人系统,它能够实时响应虚拟现实中用户的动作和手势,允许用户在小空间中与远程团队协作。

论文网址:https://infosci.cornell.edu/~mose/papers/UIST2023_VRoxy.pdf

扎克伯格:到2024年AI将成为Meta最大的投资领域

Meta公司股价下跌3%后,扎克伯格强调到2024年AI将成为其最大投资领域,发布开源AI模型,并招聘员工以推动元宇宙发展。

????大模型动态

谷歌发布PaLI-3视觉语言模型,小体量达到SOTA!

谷歌最新发布的PaLI-3视觉语言模型以更小的体量和更快的推理速度,在多个任务中实现了SOTA性能,引起广泛关注,为视觉语言领域带来新的可能性。

论文地址:https://arxiv.org/pdf/2310.09199.pdf

【AiBase提要】

?‍???聚焦开发者

NYU重磅发现登Nature:AI神经网络具有类人泛化能力

研究人员通过Meta-Learning for Compositionality(MLC)方法,成功培养神经网络实现「举一反三」能力,甚至超越人类思维。

论文链接:https://www.nature.com/articles/s41586-023-06668-3#auth-Brenden_M_-Lake-Aff1

FreeU:无需额外训练或微调即可提高图像生成质量

一句话总结核心内容: FreeU是一种新的人工智能技术,使用概率扩散模型,能够提高生成模型的图像质量,无需额外的训练或微调,广泛应用于计算机视觉任务。

更新时间 2023-10-27