教程

将推文与媒体匹配

跳转至本页面的以下主题

相关产品

[THIS CONTENT is being updated to reflect PT 2.0, and is UNPUBLISHED]

[Concepts: native media, media = photos, videos, gifs, native != vine and periscope]

Add: has:images, has:videos

* Discussion of url_contains needs: differences between url: and url_contains: (product, token matching)

* Intro to enhanced URL unwinding/filtering, or reference to new page (next steps)?

--------------------------

 

简介

Twitter 用户在推文中添加照片、视频和 GIF 的频率越来越高。
在 Twitter 上,有两种方式来分享这些类型的媒体。你可以添加指向媒体托管平台的链接,也可以通过 Twitter 用户界面“附加”媒体。

在 Twitter 早期,最常见的方式是添加指向托管在其他网站上的内容的链接。而如今,最常见的方式是在 Twitter 上本地分享媒体内容。(若要详细了解在 Twitter 上分享媒体的操作演变,请查看[此处]。)
使用 Twitter 用户界面将媒体附加到推文时,此媒体被称为托管在 Twitter 平台上的“本地”媒体。

通过 Twitter 的 PowerTrack 筛选语言,你能够筛选 Twitter Firehose 以获取与你、你的项目或你的品牌相关的数据。

PowerTrack 运算符使你能够指定实时提供给你的内容。PowerTrack 提供运算符,使你能够匹配感兴趣的推文属性。PowerTrack 提供 Firehose 筛选语法,使希望使用包含“snow'”、“rain”或“flood”关键词的照片和视频发推的用户能够编写如下 PowerTrack 筛选器:

(snow OR rain OR flood) has:videos

 

用于匹配媒体的 PowerTrack 运算符

筛选带有媒体内容的推文时,存在两种类型的运算符,它们与链接以及“附加”到推文的本地媒体相关。

  • 本地媒体
  • 托管在其他位置的媒体

这两类运算符都有助于匹配包含媒体链接的推文。

 

has:mediahas:links 运算符是 PowerTrack 中的两个选项,均有助于匹配包含媒体链接的推文。但是,它们的运作原理和返回的内容存在一些显著差异。与 has:links 相比,has:media 的范围窄得多。

本地媒体

另一个类型重点关注本地媒体(由照片和视频组成),包括 has:media、has:videos 和 has:images。请注意,has:videos 运算符与 GIF 匹配,推文中包含的元数据表示它是视频还是 GIF。Also, the rule clause of has:media is the same as (has:images OR has:videos).
has:media

[UPDATE:Specifically, has:media only looks for Tweets with content in the twitter_entities.media field, which only ever includes pic.twitter.com links for images uploaded directly through Twitter, as of the time of writing.This could change in the future, if Twitter begins including more types of content in the “media” entity, but since photos are the only media that Twitter allows to be directly uploaded by the user today, there are no references to other types or sources of media.]

  • has:media
  • has:images,返回包含本地图像(如 pic.twitter.com)的所有推文
  • has:videos,返回包含本地视频(不包括 vine 和 periscope)的所有推文

托管在其他位置的媒体

其中一种类型重点关注推文中的 URL,包括 has:linksurl:url_contains:运算符。

has:links
另一方面,has:links 运算符将返回推文正文中带有链接的任何动态,无论链接内容是什么。这包括上传到 Twitter 的任何媒体,因为当 Twitter 用户上传照片时会生成 pic.twitter.com URL,但这当然不限于照片。has:links 单独使用时,只返回包含 URL 的任何动态,如果你只关心带有图像或视频的推文,那么这可能是大量目标不明确的数据。因此,has:links 仅应与关键词或者其他更明确地指向所需内容的运算符结合使用。

但是,如果你和你的品牌想知道客户每次通过推文发布关于你的公司或产品的照片的情况,而不管照片是直接上传到 Twitter 还是上传到其他受欢迎的社交平台上,那该怎么办呢?例如,如果 Twitter 用户将一张照片上传到了 Flickr,然后在 Twitter 上分享了此链接,会怎么样呢?仅使用 has:media 运算符的规则会错过此推文,而 has:links 运算符将提交此推文,但也会向你提供大量无关内容。在这种情况下,url_contains: 运算符很有用。

url_contains
url_contains: 运算符是筛选 has:media 不涵盖的媒体的最有用的方式。url_contains: 运算符与 URL 子字符串匹配。可将它用引号引起来,以允许在查询中包含顶级域。例如,你可以筛选:

      url:"flickr.com"
    

此特定搜索会返回具有 flickr.com 链接的动态。另一方面,如果你只对你的产品或公司显示在推文中的 URL 的时间感兴趣,可执行以下内容:

      url:PiedPiper
    

采用 url: 运算符将返回 URL 中的任何位置出现“PiedPiper”标记的任何动态,而无论 URL 是来自 PiedPiper.com 或者甚至如下所示:

      http://www.networkworld.com/community/blog/valley-startup-spotlight-piedpiper-makes-social-media-fire-hose-seem-small
    

回到上述场景,如果你想跟踪的推文中有照片已发布到 Twitter 且推文中提及了你的公司或产品,你可使用以下语法。

      (PiedPiper OR url:PiedPiper) (url_contains:"flickr.com" OR has:media)
    

然后,你可以将其他“url_contains”词添加到第二组,以获取想要捕获的其他图像托管服务。这也适用于视频托管服务,你只需确定来自该服务的链接使用的结构,并将其合并到其他 url_contains 词中。

后续步骤

  • 了解更多关于 PowerTrack 运算符的信息
  • 详细了解如何识别和匹配已转推和已引用的推文。 
  • 详细了解 Twitter 的演变及其对历史研究的影响。

准备好构建你的解决方案了吗?

阅读文件,然后开始吧