一次性 Historical PowerTrack 作业

教程

简介

Historical PowerTrack (HPT) 采用基于作业的批处理设计批量提供推文。如果你要购买一次性作业，则需要遵循一个简单的流程来制定日期范围和一组筛选规则，然后使用我们建议的一个流程来下载此作业。Twitter 还为希望访问多个作业的个人提供基于订阅的选项。

根据请求时间的长短，可能需要几个小时或几天的时间才能生成作业。每 10 分钟会生成一个数据文件，其中至少包含一条推文。因此，无论匹配的推文数量是多少，一个 30 天的数据集通常会包含大约 4,300 个文件。

要详细了解 Historical PowerTrack 产品，请阅读概述文档。

注意：请记住，一次性作业不需要进行任何 Historical PowerTrack API 端点的相关工作。你的账号经理会为你完成大部分工作。

设置一次性作业需要执行的第一步是，为作业制定一组规则和数据帧。最多可向作业添加 1000 条筛选规则，每条规则可包含的字符数不超过 2048 个。这将确保你只会收到与你正在处理的项目相关的推文。

要详细了解如何构建一组规则，请阅读以下文档：

制定规则集之后，请提交以下表单，以便与我们的团队联系。然后我们会审查作业并为你做出估算。

想象一下，你的 HPT 作业可能包含上千个需要下载、解压缩和合并的文件，因此你可能想要使用自动化流程。我们在以下页面上列出了一些示例策略，可帮助你处理数据！

所有返回推文的 Twitter API 均可提供使用 JavaScript 对象表示法 (JSON) 编码的数据。JSON 基于键值对，具有命名属性和关联值。除了文本内容本身之外，一篇推文可具有与该内容相关的 140 多个属性。

要详细了解这些属性和推文有效负载的组织，请阅读我们的数据字典文档。

Historical PowerTrack 产品提供的每篇推文还将包含匹配规则增强功能。如果使用多条规则，则匹配规则 ID 可用于标识作业中每篇推文所匹配的规则。若要详细了解此增强功能，请访问我们的 PowerTrack 数据格式页面。