使用自操作系统计算机框架让AI完全控制您的PC自主完成任务

2023-12-05 09:46:15深情的哈密瓜

能够独立思考和行动的计算机的想法不再是一个遥远的梦想。这要归功于使用ChatGPT视觉创建的独特演示。人工智能(AI)将我们带入了一个新时代的边缘,机器无需人工干预即可执行任务。

使用自操作系统计算机框架让AI完全控制您的PC自主完成任务

自操作计算机框架–使多模式模型能够操作计算机的框架。使用与人类操作员相同的输入和输出,使用ChatGPTVision查看屏幕,并决定一系列鼠标和键盘操作以实现目标。

值得一提的是,目前GPT-4Visions估计XY鼠标点击位置的错误率相当高。然而,该框架旨在跟踪多模式模型随时间的进展,渴望在计算机操作中实现人类水平的性能。

使用人工智能控制您的电脑

这一令人着迷的发展不仅适用于技术专家,也适用于技术专家。任何具有一定技术知识的人都可以探索甚至自行建立。由于OpenAI最近推出了新的ChatGPT创建服务,任何人都可以在短短几分钟内创建定制的AI模型,而无需编写一行代码。有关如何创建自定义GPTAI模型的更多信息,请跳至我们之前的文章

这次演示的核心是人工智能,它被用来让机器模仿人类的思维。人工智能系统旨在处理视觉数据、理解复杂信息并自行采取行动。当人工智能集成到计算机中时,它会将其转变为一个独立的操作员,能够启动应用程序并浏览网页,而无需人的输入。

如果您感兴趣并想亲身体验这一点,您可以创建自己的人工智能驱动计算机。首先访问GitHub,这是一个开发人员共享工作的平台。寻找OtherSideAI的项目并将其作为起点。下一步是在您的计算机上设置Python环境。Python是人工智能开发中流行的编程语言,因为它功能强大且易于使用。一旦Python启动并运行,激活它并安装AI运行所需的组件。

兼容性:专为各种多式联运模型而设计。

集成:目前与GPT-4v集成作为默认模型。

未来计划:支持其他型号。this

在人工智能接管之前,你需要调整一些设置。调整环境变量,以便您的计算机知道在哪里可以找到AI的文件。然后,更改系统的权限以允许AI与您的操作系统交互。这使它可以执行打开文件和运行其他软件等任务。

现在到了令人兴奋的部分:观看人工智能的运行。您将看到它在计算机界面中导航,通过视觉识别图标和菜单。它可以模拟鼠标点击和击键来打开应用程序和浏览互联网。人工智能的在线搜索能力尤其令人印象深刻,显示了其查找和处理网络信息的能力。

让人工智能完全控制你的电脑的好处

重复性任务的自动化:人工智能可以自动执行重复性或例行的任务。例如,它可以管理电子邮件排序、自动数据输入或根据视觉提示和学习模式处理文件组织。

增强的可访问性:对于残疾人来说,具有屏幕阅读功能的人工智能可以极大地提高计算机的可访问性。它可以解释视觉信息并以其他格式(例如音频或简化的视觉效果)传达它,从而帮助有视觉障碍的用户。

高效的故障排除和支持:在IT支持和故障排除中,人工智能可以直观地识别屏幕上的问题,指导用户修复,甚至自主解决问题,从而提高效率并减少停机时间。

学习和适应:人工智能系统可以从用户的行为、偏好和频繁任务中学习。随着时间的推移,它可以适应优化工作流程、建议快捷方式或重新组织界面以适应用户的习惯。

实时翻译和协助:对于与外语内容交互的用户,人工智能可以提供实时翻译。它还可以在应用程序中提供上下文相关的帮助,从而改善用户体验和生产力。

增强的安全性和监控:凭借持续监控屏幕的能力,人工智能可以检测可疑活动,例如网络钓鱼尝试或未经授权的访问,并向用户发出警报或采取预防措施。

与其他人工智能服务集成:人工智能可以与语言模型、预测分析等其他人工智能工具交互,提供各种人工智能功能的无缝集成,从而提供更全面的用户体验。

隐私和安全问题

赋予人工智能系统对计算机的完全控制权,再加上视觉解释屏幕的能力,可以带来多种好处,特别是在需要自动化、可访问性和增强用户交互的领域:

虽然人工智能驱动的计算机的功能令人兴奋,但它们也提出了重要的问题。给予人工智能这种程度的控制意味着什么?我们的安全或隐私是否存在风险?当您探索自操作系统的计算机可以做什么时,考虑这些问题很重要。当我们开始将这些系统融入我们的日常生活时,了解人工智能的力量和潜在风险至关重要。

由人工智能引导的自操作系统计算机系统的兴起是技术创新的一个重要里程碑。通过遵循概述的步骤,您可以设置自己的系统并发现其功能。随着人工智能技术的不断进步,了解其影响至关重要,确保我们深思熟虑、负责任地将其融入我们的生活。如需快速入门说明,请跳转至官方GitHub存储库。

推荐阅读

阅读排行