视障人士称赞了丹麦初创公司 Be My Eyes 的最新创新,该创新将 GPT-4 的图像识别功能集成到一个突破性的应用程序功能中。被称为“虚拟志愿者”的物体识别工具被描述为改变视力障碍者生活的工具,因为它可以回答与发送给它的图像相关的任何问题。该功能允许用户捕捉日常物品的图像,例如配料,并即时接收相关信息,例如食谱。
如果他们更喜欢外出就餐,他们可以使用该应用程序上传地图图像,并接收前往附近餐厅的路线。抵达后,他们可以使用该应用程序为菜单拍照,并聆听可用的选项。此外,如果他们想在健身房燃烧掉多余的卡路里,他们可以方便地使用智能手机摄像头来定位跑步机。
Be My Eyes 的首席执行官 Mike Buckley 确认,虽然我们目前正在经历AI 炒作周期,但一些 Beta 测试人员表示他们相信该应用程序正在改变生活。他进一步指出,这项创新有可能带来变革,为视障社区提供无与伦比的资源,以更好地驾驭他们的物理环境,照顾他们的日常必需品,并获得更大的独立性。
Be My Eyes 的虚拟志愿者功能利用了 OpenAI 软件的升级版本。GPT-4 被认为是多模式的,这意味着它能够分析文本和视觉输入。Be My Eyes 热衷于试用新功能,因为以前版本的软件表现不佳。尽管文本到图像系统已经存在了一段时间,但该初创公司从未相信它们的有效性。根据 Buckley 的说法,市场上可用的工具有很多缺点,从经常出错到无法交谈,这使它们无法满足社区的需求。
根据 Buckley 的说法,GPT-4 的图像识别能力非常出色,并且由 OpenAI 支持的对话和分析层进一步增强,使该功能更有价值和有用。以前,Be My Eyes 完全依靠人类志愿者来支持他们的用户。然而,借助新的虚拟志愿者功能,OpenAI 声称可以实现相同级别的上下文和理解。尽管如此,如果用户没有收到满意的回复或只是更喜欢人际关系,他们仍然可以联系志愿者。
尽管初步结果令人鼓舞,但巴克利强调需要谨慎推出免费服务。来自 Beta 测试人员和更广泛社区的意见和反馈对于确定发布的速度和范围至关重要。最终,巴克利设想该平台将为用户提供支持和机会。Be My Eyes 计划通过更加强调可访问性来帮助企业更有效地为客户服务。
巴克利认为,这项技术不仅有可能赋予盲人或视力低下的人权力,还可以为他们提供一个向世界展示自己能力的平台。他认为这项技术可以改变游戏规则,使视障人士能够利用他们的才能和技能。对于巴克利来说,这代表了一种真正令人信服的可能性。