教程

一次性 Historical PowerTrack 作业

简介

Historical PowerTrack (HPT) 采用基于作业的批处理设计批量提供推文。如果你要购买一次性作业,则需要遵循一个简单的流程来制定日期范围和一组筛选规则,然后使用我们建议的一个流程来下载此作业。Twitter 还为希望访问多个作业的个人提供基于订阅的选项。

根据请求时间的长短,可能需要几个小时或几天的时间才能生成作业。每 10 分钟会生成一个数据文件,其中至少包含一条推文。因此,无论匹配的推文数量是多少,一个 30 天的数据集通常会包含大约 4,300 个文件。

要详细了解 Historical PowerTrack 产品,请阅读概述文档

注意:请记住,一次性作业不需要进行任何 Historical PowerTrack API 端点的相关工作。你的账号经理会为你完成大部分工作。

规则和筛选

设置一次性作业需要执行的第一步是,为作业制定一组规则和数据帧。最多可向作业添加 1000 条筛选规则,每条规则可包含的字符数不超过 2048 个。这将确保你只会收到与你正在处理的项目相关的推文。

要详细了解如何构建一组规则,请阅读以下文档:

Historical PowerTrack 规则和筛选

作业提交

制定规则集之后,请提交以下表单,以便与我们的团队联系。然后我们会审查作业并为你做出估算。

请求作业

下载作业

想象一下,你的 HPT 作业可能包含上千个需要下载、解压缩和合并的文件,因此你可能想要使用自动化流程。我们在以下页面上列出了一些示例策略,可帮助你处理数据!

下载作业

数据格式

所有返回推文的 Twitter API 均可提供使用 JavaScript 对象表示法 (JSON) 编码的数据。JSON 基于键值对,具有命名属性和关联值。除了文本内容本身之外,一篇推文可具有与该内容相关的 140 多个属性。

要详细了解这些属性和推文有效负载的组织,请阅读我们的数据字典文档

Historical PowerTrack 产品提供的每篇推文还将包含匹配规则增强功能。如果使用多条规则,则匹配规则 ID 可用于标识作业中每篇推文所匹配的规则。若要详细了解此增强功能,请访问我们的 PowerTrack 数据格式页面