原文towardsdatascience.com/top-5-geospatial-data-apis-for-advanced-analysis-79349605c86dhttps://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8f77c7bff0dc1c4b9e519795f27f899e.pngKyle Glenn 在 Unsplash来源unsplash.com/es/kylejglenn地理数据在许多分析中都很重要它使我们能够根据位置和空间模式做出决策。地理数据可以派上用场的项目示例包括预测房价、交通路线优化或为企业制定营销策略。然而作为一名数据科学家您将经常面临挑战即从哪里获取这些数据。在许多情况下存在提供地理数据信息的公共来源然而在许多情况下他们提供的信息需要修改以便我们进行所需的分析。本文将评估五个最有用的 API用于获取大规模地理数据。我们将评估它们的用法、优缺点以及它们提供信息的主要应用。将本文视为这些 API 使用和应用的基础以便您可以稍后深入了解它们提供的所有工具。1. OverpassOverpass API 允许访问 OpenStreetMap 网站上的信息。OpenStreetMap 是一个开放的地理数据库包含广泛的地理空间数据从地下路线信息到道路、山脉或河流的位置信息。OpenStreetMap 中可用的数据是开放的并由全球用户维护因此数据的完整性水平在很大程度上取决于地区因为有些地区我们可以找到更多活跃的用户因此该平台有更多数据。然而在大多数情况下完整性程度很高使我们能够为我们的地理分析收集大量信息。Overpass API 使用一种称为 Overpass QL 的语言来设计查询以访问 OpenStreetMap 上可用的数据。这种高度可定制的语言使我们能够创建特定的查询仅从平台上访问分析中感兴趣的信息。优点完全免费因为 OpenStreetMap 是一个开放数据库因此 API 的使用也是完全免费的。灵活的查询可以使用 Overpass QL 语言高度定制查询以仅访问感兴趣的信息。查询中还可以定制其他方面例如数据输出格式。此外通过查询您可以轻松过滤想要获取的地理数据以及这些数据的搜索区域。全球数据OpenStreetMap 包含全球数据因此通过 API 可访问的信息并不局限于特定区域。缺点返回 API 数据的质量如前所述OpenStreetMap 平台是一个由志愿者维护的开放网站。因此数据质量取决于用户这可能导致某些用户活动低下的地区数据不完整。查询构建所需的学习Overpass API 中的查询使用一种称为 Overpass QL 的语言进行当不熟悉该语言时学习过程可能一开始特别缓慢。后处理需求API 返回的数据无论是 CSV 格式还是 JSON 格式都包含了地理元素的坐标但并不提供我们可以直接用于分析的已处理多边形或多多边形。因此我们需要将原始数据转换为获取不同的多边形。许可证OpenStreetMap 数据可用于任何目的包括商业用途其使用受我们分发许可证 ODbL 的约束。常见问题解答用例 – 在库克斯哈文检索公交车站以下示例展示了我们如何使用 Overpass API 获取位于库克斯哈文的所有公交车站。库克斯哈文是德国北部的一个小镇位于北海沿岸。以下代码显示了查询和用于通过 API 访问信息的端点。查询指定了搜索区域Cuxhaven、要搜索的元素类型bus_stop以及输出格式json。get_overpass_data函数是一个通用函数可以与任何查询一起使用以从 Overpass API 获取响应。