一开始你可能会想,为什么你还需要一个 API 来截图呢? 如果您只需按键盘上的一个按钮就可以做到这一点,真的有必要吗? 在本文中,我们将讨论您可能想要使用 API 的原因,有哪些优势,可以有哪些用例,最后,您如何实际使用 API 截屏。

为什么要使用 API?

那么,为什么是 API? 非常简短的回答——自动化。 长答案是您可以使用 API 做很多事情,而自动化,尤其是对于任何可重复的任务,是您可能选择使用 Screenshot API 的可靠原因之一。 它是一个 API 的简单事实意味着它对于您可能想要使用它的任何应用程序都可以扩展且非常可靠。 此外,屏幕截图 API 可以轻松保存整个网页的图像,而无需使用浏览器访问实际网站。

以下图为例。 只需一个 API 调用,您就可以在几秒钟内下载网页的精确副本,并将其以 JPEG 或 PNG 格式保存到您的本地计算机。

API 使用

现在的大多数网页都不适合单个浏览器屏幕,可能需要滚动几次才能到达底部。 因此,手动保存网页图像可能需要几分钟或更长时间,因为您需要打开浏览器,转到 URL,等待网页加载,然后截屏以捕获页面的多个部分并使用应用程序您可以编辑和重建整个图像。 如果您只想保存页面的一小部分,这可能是可行的,但是如果您打算捕获大量网页,那么您只需编写一个简单的代码来利用 API 肯定会浪费时间并使整个过程自动化,甚至获得更好的结果。

为了进一步向您展示屏幕截图 API 的有用性,我们根据广泛的用户列出了它的一些最受欢迎的应用程序。

截图 API 用例

将网络抓取提升到一个新的水平 - 使用屏幕截图 API 可以大大增强您的网页抓取项目。 有多种方法可以利用这种 API 的功能,并且可以轻松地将其集成到任何现有系统中。 使用它来验证您的抓取工具是否获得了正确的源代码,在几分钟内捕获数千个屏幕截图并将其用作您可以从抓取中获得的常用文本之外的另一个数据点,甚至可以通过快照跟踪任何网站更改,因此如有必要,您可以快速对刮刀进行一些调整。

用于学习和研究 - 如果您可以在几秒钟内捕获并下载您在各个网站上找到的研究和研究材料,这样您就可以专注于真正重要的事情,这不是最好的吗? 正如我们之前指出的那样,手动保存网页快照将花费您大量的时间和精力,因此很难证明一开始就这样做是合理的。 使用 API 自动执行此任务将更有意义,并且可以显着减少您的工作量。 保存在线研究论文、书籍和有用文章的副本将变得轻而易举,并且可以大大提高其可访问性,因为图像可以保存在本地硬盘驱动器或云中。

非常适合博主、内容创建者和 Web 开发人员 - 它确实是一个简单的 API,但在专业人士的手中可以是一个非常有效的 API。 如果您出于任何原因撰写评论或制作网站列表,API 可以捕获任何网页的完美图像,并且在您的文章中包含该图像可以提高用户参与度。 对于想要展示其作品集的 Web 开发人员和自由职业者,如果您已经构建了多个网站,那么使用 API 几乎是必须的,因为它可以以最小的努力以尽可能最佳的分辨率完美地截取您的工作截图。

使用 ProxyCrawl 的 Screenshots API

有很多网站提供自动截图 API,但要找到适合您的 API 可能会很麻烦。 但是您无需再看下去,因为 ProxyCrawl 目前正在提供最好的 API 屏幕截图服务之一,它具有内置的反机器人检测功能,可以绕过被阻止的请求和验证码。 通过使用此屏幕截图 API,您可以保持匿名,因为该 API 构建在由人工智能管理的数千个住宅和数据中心代理之上,因此您始终可以获得您想要的任何网站的完美高分辨率图像。

使用 API 很容易,因为每个请求都将从以下基本部分开始:

1
https://api.proxycrawl.com/screenshots

ProxyCrawl 将在创建使用该服务所需的帐户时提供一个私有令牌:

1
?token=PRIVATE_TOKEN

在终端或命令提示符上执行一个非常简单的 curl 命令将允许您抓取任何网页并将图像保存到您选择的任何兼容文件类型:

1
卷曲 "https://api.proxycrawl.com/screenshots?token=PRIVATE_TOKEN&url=https%3A%2F%2Fwww.amazon.com%2Famazon-books%2Fb%3Fie%3DUTF8%26node%3D13270229011" > 测试.jpeg

结果将是整个网页以最佳分辨率的干净图像,并且没有 Web 浏览器的不必要部分,例如滚动条和地址栏:

ProxyCrawl 截图 API

现在,如果您想要扩展并完全自动化该过程,您可以使用任何您喜欢的编程语言来构建您的代码。 ProxyCrawl 有 免费使用,可以毫不妥协地集成到任何现有系统。 如果您想围绕 API 创建项目,这也非常简单。

下面是如何使用 Screenshots API 的简单演示 ProxyCrawl 节点库:

1
2
3
4
5
6
7
8
常量 { 截图API } = 要求('代理爬行');
常量 api = 截图API({ 象征: 'PRIVATE_TOKEN' });
常量 fs = 要求('fs');

蜜蜂。得到('https://www.apple.com').然后((响应) => {
fs。写文件同步('苹果.jpg', 回复。身体,{ 编码: '二进制' });
领事.日志(“截图保存!”);
});

除了默认功能外,API 还具有可选参数,您可以根据需要使用这些参数:

  • 设备 - 如果您希望在特定设备上捕获图像,请传递此参数。 可用的选项是 desktop and mobile.
  • USER_AGENT - 如果您想要一个比设备参数更具体的选项,请使用此选项。 这是一个字符串,可让您将自定义用户代理传递给 API。
  • css_click_selector - 此参数将让您指示 API 在浏览器捕获生成的网页之前单击页面中的元素。 该值应该是一个有效的 CSS 选择器,例如, .some-other-button or #some-button, 并且应该被完全编码。
  • 滚动 - 将此用于无限滚动的网站。 API 将滚动浏览整个页面,然后以设置的滚动间隔捕获屏幕截图。 默认滚动为 10 秒,但可通过其子参数设置最大为 60 scroll_interval=value。 例: &scroll=true&scroll_interval=20
  • 商店 - 接受布尔值 &store=true 将您的屏幕截图副本直接存储到 ProxyCrawl 的 云存储.

将任何可用参数传递给 API,如下所示:

1
2
3
4
5
6
7
8
常量 { 截图API } = 要求('代理爬行');
常量 api = 截图API({ 象征: 'PRIVATE_TOKEN' });
常量 fs = 要求('fs');

蜜蜂。得到('https://www.amazon.com',{ 设备: '移动的' })。然后((响应) => {
fs。写文件同步('亚马逊.jpg', 回复。身体,{ 编码: '二进制' });
领事.日志(“截图保存!”);
});

结果将是网站的移动版本:

亚马逊网页

总结

毫无疑问,一遍又一遍地做同样的任务会很乏味。 因此,如果这是一项重复性的任务,例如拍摄数十、数百甚至数千张网站截图,那么最好的选择是使用 API 将其自动化。 它不仅可以节省时间,还可以提供更好和一致的结果。

ProxyCrawl 的截图 API 是目前市场上的最佳选择之一,因为它确实提供了易于使用的服务,并且由于其功能和卓越的可靠性,它还提供了极大的灵活性。 每个 API 调用都利用来自大量代理的 IP,并通过人工智能进行了优化,因此您可以保持匿名并避免机器人检测,同时以高分辨率捕获网站的图像。