近日,Duck AI发布了一项引人注目的创新——DuckTrack,一款多模式计算机交互数据收集器。该工具的研发旨在为计算机代理的进步提供精准而准确的用户交互跟踪,成为训练智能系统的关键工具。
DuckTrack能够通过用户友好的桌面应用程序在主要操作系统上同步收集鼠标、键盘、屏幕视频和音频数据。更令人振奋的是,DuckTrack还启动了社区数据收集倡议,旨在邀请开源社区成员参与多样化的计算机交互数据收集。这一努力将有助于丰富数据集,为智能系统的培训提供更多可能性。
虽然DuckTrack在多方面表现出色,例如在绘图任务中,其结构相似性指数(SSIM)在DeepTruck中持续超过0.9,每个事件的记录误差仅为0.03毫秒 ±0.4毫秒,超过市场上现有跟踪器的准确性。然而,它也存在一些局限性,如在模拟双击或三击时的挑战,以及不能记录触控板手势等。不过,开发者们正在积极努力解决这些问题,通过与社区的持续互动来提升DuckTrack的功能。
研究人员在不同系统上进行了DuckTrack的测试,包括运行macOS Sonoma14.0的M2Pro MBP14,运行PopOS!22.10(基于Ubuntu)和Windows1022H2的Intel i7-10510U System76Lemur Pro9。在ReCAPTCHA任务中,作为人类移动的代理,DuckTrack在十次试验中取得了100%的成功率。尽管硬件的差异可能轻微影响性能,但在各个操作系统上的一致准确性彰显了DuckTrack的可靠性。
DuckTrack通过其精确的数据记录和播放功能,以及积极参与社区的态度,展现出对于计算机交互数据收集的革命性影响。在不断改进和完善中,DuckTrack正为实现更复杂、无缝的多模式计算机交互体验铺平道路。如果您对卓越的播放和跟踪功能有需求,DuckTrack无疑是一个首选。
项目网址:https://github.com/TheDuckAI/DuckTrack
官方博客:https://duckai.org/blog/ducktrack