做过爬虫或者自动化测试的朋友,应该都体会过被 Selenium 和 Puppeteer 支配的恐惧。 为了点一个按钮,我们得去扒网页源码,找 ID,找 Class。一旦网页改版,精心写好的脚本瞬间报错,维护起来既耗时又耗力。 那个时候我就在想,要是 AI 能像人一样,看一眼屏幕就知道点哪里,该多好。 如今,Google 把这个想法变成了现实。在 ...