这个人工智能只需看几张照片就能找到你的位置
安全的社交媒体做法包括不发布展示个人信息(例如车牌号、街道名称或门牌号)的照片。但如果我告诉你, 生成式人工智能仍然可以找到一种方法来定位你——仅仅从你的照片背景?
随着生成式人工智能的不断发展,新的用例正在被识别。现在,斯坦福大学的研究生开发了一款应用程序,可以从街景甚至图像中检测您的位置。
该项目称为预测图像地理位置(PIGEON),在大多数情况下,只需查看该位置的谷歌街景即可准确确定该特定位置。
根据预印本论文,PIGEON 可以以 92% 的准确度预测图中的国家/地区,并且在超过 40% 的猜测中,它可以精确定位到目标位置 25 公里以内的位置。
要了解这是多么令人印象深刻,PIGEON 在GeoGuessr玩家中排名前 0.01% ,在这款游戏中,用户猜测从 Google 街景拍摄的照片的位置。该游戏是该项目的起源。
PIGEON 还在一系列六场比赛中击败了世界上最好的 GeoGuessr 职业选手之一 Trevor Rainbolt,在线直播观看次数超过 170 万次。
那么PIGEON到底是如何运作的呢?
学生们利用了 CLIP,这是 OpenAI 开发的一种神经网络,可以通过训练要识别的视觉类别名称来连接文本和图像。
然后,受 GeoGuessr 的启发,PIGEON 在包含来自 GeoGuessr 的 100,000 个原始随机采样位置的数据集和一组下载的四张图像上进行训练,以跨越给定位置的整个“全景图”,总共生成 400,000 张图像。
与其他人工智能模型训练的图像数量相比,PIGEON 的模型相形见绌。作为参考,OpenAI 流行的图像生成模型 DALL-E 2 经过数亿张图像的训练。
学生们还开发了一个名为 PIGEOTTO 的独立模型,该模型接受了来自 Flickr 和维基百科的超过 400 万张照片的训练,以从单个图像中识别位置作为输入。
据该论文称,PIGEOTTO 的性能在图像地理定位基准上取得了令人印象深刻的结果,在城市精度方面比之前最先进的结果高出 7.7%,在国家精度方面高出 29.8%。
本文讨论了与该模型相关的道德考虑因素,包括收益和风险。一方面,图像地理定位有许多积极的用例,例如自动驾驶、视觉调查以及简单地满足对照片拍摄地点的好奇心。
然而,负面影响包括最公然侵犯隐私。因此,根据该论文,学生们决定不公开发布模型权重,仅发布用于学术验证的代码。
版权声明
本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。