发展业务并非易事,您会遇到很多挑战,如果您没有做好准备,您可能很难成功。 发展业务的明显方法之一是以最低的成本向尽可能多的潜在客户宣传您的产品,而一种行之有效的方法是产生潜在客户。

从营销的角度来看,潜在客户生成是一种将潜在客户转化为对您的业务或产品具有指示性兴趣的人的方法。 有多种方法可以产生潜在客户,以及不同类型的潜在客户。 但是,在您开始建立和产生潜在客户之前,您需要先找到一种方法来接触您的潜在客户。 与他们取得联系的最佳方式是简单地从各种社交媒体网站(尤其是 LinkedIn)获取电子邮件。

那么,为什么是LinkedIn? 简而言之,您可以在这里找到提升业务水平的专业人士。 它也是财富 500 强公司的首选平台,这意味着您很有可能在这里找到目标受众。 简而言之,如果您的企业需要为您的目标活动提供公司电子邮件,那么这是最好的起点。

一个易于理解的电子邮件提取指南

本文的主要目的是帮助您通过 LinkedIn 获取公司潜在客户。 我们将向您展示如何使用 ProxyCrawl 产品来抓取用户个人资料及其各自的公司页面并从公司域中提取电子邮件的分步指南。

为了帮助您入门,请允许我们简要讨论我们将用于实现目标的两个主要 API:

抓取 API – 这将是我们项目的主要工具。 它将允许我们有效地抓取和抓取 LinkedIn 中公开可用的个人资料,而不会被阻止。

潜在客户 API – 一旦我们使用我们的 Crawling API 获得了公司的域,我们将能够使用 Leads API 来抓取公司域以获取新的潜在客户。 新鲜意味着将提取的信息是实时的,不会从任何数据库缓存或存储,这将消除对收到无效或过时电子邮件的任何担忧。

我们提到的两个 API 产品将作为我们爬虫的支柱。 为了展示这些 API 的有效性和灵活性,我们将使用 Node.js 进行编码并利用 代理爬取 在图书馆的帮助下 切里奥 抓取我们项目所需的数据。

使用 Node.js 抓取 LinkedIn 上的用户资料和公司页面

出于本文的目的,我们将使用 Visual Studio 代码,因为它是可在大多数操作系统上使用的最流行且易于访问的编辑器之一。

在我们深入编码之前,让我们准备我们的项目结构并确保安装所有先决条件。

  1. 创建一个新的 Node.js 项目(示例名称: LinkedIn)
  2. 安装 Node.js 的 ProxyCrawl 库, 打开终端并执行 npm 我代理爬行
  3. 安装 节点 Cheerio 库, 只需输入 npm 我欢呼
  4. 为 Crawling API 创建一个 js 文件。 (例子: 启动.js)
  5. 为 Leads API 创建辅助 js 文件。 (例子: Leads.js)

完成后,让我们开始在我们创建的第一个 .js 文件 (Start.js) 中编写代码。 我们的前两行将声明所有常量,并在这个项目中需要必要的 API 类。

1
2
常量 { 抓取API } = 要求('代理爬行');
常量 欢呼= 要求('cheerio');

下一行很重要,因为它将保存您的 ProxyCrawl 令牌的值:

1
常量 api =  抓取API({ 象征: 'normal_token' });

现在,我们可以基于 ProxyCrawl 库编写一个简单的 API 调用来抓取您选择的 LinkedIn 用户资料。 这部分我们还将利用cheerio解析返回的HTML源代码,以抓取用户最近的公司,然后在控制台日志中显示公司简介的URL。

1
2
3
4
5
6
7
8
蜜蜂。得到('https://www.linkedin.com/in/williamhgates').然后((响应) => {
if (回复。状态码 === 200){
常量 $ = 快乐。加载(回复。身体);
常量 公司网址 = $('.experience__list a');
常量 输出 = 公司网址。属性('href');
领事.日志('公司页面:', 输出);
}
});

我们代码的下一部分将抓取前一部分的“输出”。 这将允许我们获取公司的实际链接,并且从那里,Crawling API 将再次执行它的技巧来爬取公司的 LinkedIn 页面。 Cheerio 然后将第二次解析 HTML 并显示公司的实际网站。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
// 之前的代码
蜜蜂。得到('https://www.linkedin.com/in/williamhgates').然后((响应) => {
if (回复。状态码 === 200){
常量 $ = 快乐。加载(回复。身体);
常量 公司网址 = $('.experience__list a');
常量 输出 = 公司网址。属性('href');
领事.日志('公司页面:', 输出);

// 新代码
蜜蜂。得到(输出)。然后((响应) => {
if (回复。状态码 === 200){
常量 $ = 快乐。加载(回复。身体);
常量 网站 = $('.basic-info-item__description a');
领事.日志('网站: ',网站。文本());
}
});
}
});

该 js 文件现已完成,一旦执行,程序将抓取您的目标 LinkedIn 个人资料,并将返回 LinkedIn 页面 URL 和用户公司的网站,如下面的示例所示:

输出:

Javascript 文件输出

使用 ProxyCrawl 的 Leads API 获取新的电子邮件

现在我们已经获得了公司的网站,下一步是使用 ProxyCrawl 的 Leads API 从公司域中抓取任何电子邮件。 继续打开您在本指南开头创建的第二个 .js 文件并使用 Leads API,如下所示:

1
2
3
4
5
6
7
8
9
常量 { 线索API } = 要求('代理爬行');
常量 api = 线索API({ 象征: 'private_token' });

API
.从域中获取('gatesfoundation.org')
.然后((响应) => {
领事.日志(回复。线索);
})
.捕捉((错误) => 领事.错误);

请注意,您必须省略 http:// 并输入有效域才能获得成功的 API 响应。

ProxyCrawl 线索 API

至此,我们已经完成了我们的爬虫。 如您所见,使用 API 非常简单。 只需几行代码,我们就可以抓取 LinkedIn 并获得我们正在寻找的内容。 然而,这并没有结束。

ProxyCrawl 关心每个客户,无论是开发人员还是非开发人员。 因此,我们开发了一种工具,每个人都可以使用而无需编写代码。 这 潜在客户查找器 是一个易于使用的工具,具有简单的用户界面,只需输入目标公司的域即可快速查找电子邮件。 它和你在这个例子中看到的 API 一样好用:

潜在客户查找器

总结

数据中心代理和住宅代理之间的差异
正如您可能已经知道的那样,在LinkedIn 上,公共信息是向任何无需登录即可访问该网站的任何人显示的数据,并且在公共搜索引擎上也可见。 用户可以自定义他们的个人资料设置,并设置可以公开显示多少信息的限制。 如果您希望进行成功的营销活动,那么在产生潜在客户时,此公共信息至关重要。

总之,如果您的策略是接触更多公司,那么 ProxyCrawl 可以为您和您的营销团队发挥重要作用。 通过将我们的 API 与人工智能结合使用,您可以轻松地在 LinkedIn 上抓取和抓取公开可用的数据,并在 Leads API 的帮助下从公司域中提取新的电子邮件,同时保护您的爬虫免受验证码和被阻止的请求的影响。

因此,如果您想为您未来的项目提供易于使用、快速且可靠的抓取工具,请务必查看 ProxyCrawl 的 抓取和抓取 API.