数据采集器

江南平台手游Oxylabs 研究表明在数据收集过程中网络抓取驱动了最大的营收增长

发布时间:2024-09-17 07:22:00 来源:江南平台手游官方 作者:江南平台手游官方下载

  几个月前,Oxylabs 与 Censuswide 合作,向总部在英国和美国的金融服务公司的高级数据决策人发起了问卷调查,旨在收集有关他们如何采集数据的洞察。结果揭示了清晰的趋势:网络抓取被视为最有价值的外部数据收集方法,直接促进公司创收。

  26% 的受访者认为,在所有替代数据收集方法中,网络抓取对营收的影响最大。而且网络抓取的排名仅次于内部数据收集,后者被 28% 的受访者视为最重要的营收驱动因素。与此同时,人工数据收集和第三方传统数据聚合器(例如,统计报告)各自仅获得 12% 的选票。

  这些数字揭示了金融行业的清晰变迁。该行业长期依赖内部数据并仅使用少量外部数据来予以支持,如今将内部和外部数据视为同等重要。两者相结合,可以提供企业决策所需的最准确格局,尤其是评估公司、发现未来投资机遇或管理风险。

  哪怕是在网络抓取和外部数据收集的发展初期,金融行业也是其最早采用者之一。但是,我们在过去几年见证了指数级增长。金融公司显著增加了对外部数据采集方法的投资,总体收集了更多数据。

  Oxylabs 调查发现,71% 的金融服务公司在其运营中使用了通过网络抓取收集的替代数据。内部数据在过去曾是占主导地位的数据获取方法,现在有 74% 的公司采用。两者旗鼓相当,表明那些基于数据做决策的公司将网络抓取视为不可或缺。内部数据虽然仍然不可避免,但单凭它本身已经不够。

  这一变化的最明显推动因素是激烈的竞争。各家公司争相获取原始洞察来使其企业决策更加准确,因而将新的数据来源纳入其工作管道中。由于在线公开可用信息的范围如今十分庞大,公司如何加以运用以取得优势,就看公司能发挥多大的创造力了。

  促进网络抓取增长的另一个趋势是不断变化的投资重心,例如,ESG。使用它需要花大力气查阅一个庞大的条件集合。虽然在大部分情况下无法人工实现,但大部分公司都已走向线上,因此可以使用网络抓取自动执行该过程。

  利用网络抓取,可以查找之前未发现的信息,并可能提供重要的背景信息。还可以将看似不同的各种信息片段合并起来,组成更大的格局。例如,天气预报、职位发布和卫星图像收集可以放在一起,只要数据决策人知道如何将它们提供的不同发现结果合并起来,得出宝贵的商业洞察。

  由于现在网络抓取技术在金融行业几乎是默认得到运用,主要竞争优势不在于该技术本身,而在于人力因素。即使在两家友商抓取相同网站的情况下,他们也可能专注于信息的不同部分。每家公司的数据决策人将负责找出利基来源,加以分散化,并从中提取合适的洞察。

  在英国,网络抓取排名为对营收影响最大的领先收集方法,25% 的受访者都持这一观点。与此同时,该方法在美国排第二名 (27%),落后于内部数据,后者获得了 37% 的选票。

  令人意外的是,英国公司选择“以上都不是”的比例高得多 (14%),暗示存在其他无法公开得知的数据收集方法。本文作者认为原因在于,英国公司更倾向于从范围广泛的各类不同来源收集数据,而不是从聚合器中供给。

  尽管存在这些细小差异,但这两大市场对未来的态度是一致的:网络抓取是应该专注的技术,看看这方面的投资,趋势不言自明。我们的调查表明,80% 的公司计划在来年更大程度地专注网络抓取。


江南平台手游
上一篇:我国消费市场空间持续扩大 进口来源地覆盖广、品类丰富 下一篇:应用爬虫技术有效获取网上价格数据