发表于10月13日,2020年 SEO.

如何将数据转换为内容营销活动

谎言,该死的谎言和统计数据。这个精辟的报价总结了大多数人对数据的态度。它是不可信的,不可靠,或只是普通无聊。

但在右手中,数据可以变成故事。迷人的故事。兴奋的故事。从顶级出版物获取链接的故事。

这篇文章将探索如何在线找到伟大的数据,如何使用该数据来激发一个想法,也许最重要的是,在分析数据时如何毫无责任。

我们还将简要介绍数据可视化技术,但这真的值得自己的整个帖子。可能来自具有更多平面设计经验的人。

数据源

在线有很多数据。它的 估计 那个谷歌,亚马逊,微软和Facebook在它们之间至少增加了120万吨。但这只是冰山一角。全身互联网上的数据量被认为是Zettabytes的顺序。这是一个有21个零的人。

甚至开始理解这是多少信息,想象一下它将netflix电影流媒体。宽带速度为100 Gbps,这将带您2535年。这是很多爆米花。

所以,找到正确的数据很棘手。谢天谢地,一位优秀的营销人员为您提供了一个指南。

对于我们大多数人来说,第一步很可能是谷歌。这种方式可以找到许多数据集,特别是那些来自政府或公共机构的数据集。在谷歌入数据时,有一些东西可以记住:

  • 在搜索旧数据时使用“历史”这个词
  • 在搜索中使用“数据”字样
  • 保持初始搜索广播(犯罪数据伦敦)以查看选项,然后探索不同的来源(Data.London.gov,满足警察,ONS等)。我更愿意在单独的选项卡中执行此操作,将主要搜索结果页面保持在打开
  • 一旦您知道您要查找的内容,请使用高级Google搜索.xls或.xlsx文件或政府网站
    • FileType:XLS / XLSX / PDF等
    • 网站:GOV.UK.

谷歌也有一个单独的 专门用于数据集的搜索引擎,这绝对值得一游。

最后,并非所有数据都可以轻松访问这种方式,尤其是更模糊的。 杰里米歌手 - 藤蔓,Buzzfeed新闻的数据编辑器有一个 每周通讯 正是这个原因。

大多数星期,他发送了4或5个有趣的数据集或数据故事。这些范围从 每个地方名称 在美国,到一个艺术家 48第一个吻.

最好的部分是 存档所有数据集 可以随时查看,节省您通过收件箱捕捉的麻烦,为您知道提到的电子邮件 海象喜欢聚会.

使用数据激发一个想法

我们写了 关于思想 之前。这个过程,我喜欢称之为数据驱动的想法,略有不同。

虽然汤姆的方法涉及想出一个想法,那么寻找支持它的来源,我喜欢把它转向它的头部。我寻找与我的客户的利基相关的数据集或数据驱动的文章,然后想到数据集这些问题可以回答。

例如,我们找到了所有的数据库 英国的公有艺术。这可能回答的问题是无穷无尽的,但我们专注于一个: 女性制作了多少雕塑?

在思考问题的问题时,有两件事要记住。一个问题之前已经回答了?如果没有,很棒。如果它有,你的答案会为谈话添加任何东西吗?

数据分析

一旦您拥有数据源,往往不得不要做一些操作来获取您想要的方式。政府似乎似乎在格式的尴尬Excel电子表格中更美好,以便您不期望的方式。喜欢 当行更有意义时,使用列......

平均值

作为内容营销人员/数据分析师,卑微的平均值是我们最有可能与之合作的指标。但你知道有多种平均值吗?

意思

当他们指的平均值时,大多数人都意味着什么。它通过添加所有数字来计算并将其分开的总值。或者使用纸张或excel中的平均公式。它与异常值不合作,因此如果您的数据倾斜,请稍等。

中位数

中位数是数据集的中间值,并通过订购数字来计算并找到中间值。您还可以使用电子表格选择中的中位配方。

这种措施更适合偏斜数据集。说我正在寻找伦敦的房子,我想知道一个人的平均价格。购买顶峰的所有寡头都会歪斜这么高,它会降低我。但是中位数考虑到略微更合理的房屋,导致希望不那么令人沮丧的数字。

模式

最后,我们来到了模式。这是数据集中最常见的值。如果数据集是数字,则可以使用模式公式。如果它是您想要查找的最常见的文本,那么公式就是 稍微介入,但仍然可以访问。

异常值

异常值是基于其余数据的预期要大得多或远远小的结果。如果你不小心,他们真的可以弄乱你的分析。

如果异常值是:

  • 测量错误或数据输入错误,如果可能,您应该纠正错误。如果您无法修复它,请删除该观察,因为您知道这是不正确的。
  • 不是您学习的人口的一部分(由于不寻常的属性或条件),您可以删除异常值。
  • 您正在学习的人口的自然部分,您不应该删除它。

占人口规模

许多数据驱动的内容涉及一个或多个度量的排名区域,如P在t价格或 蜘蛛瞄准。这是在许多不同的本地出版物中获得报道的绝佳方式。

但是当通过群体规模影响的指标排名区域时,存在陷阱,因为这是由此引用的 XKCD漫画 强调。

要删除此问题,我们使用人均测量。这基本上是一个花哨的拉丁语方式,说明您指的区域的人口划分了您的指标,每人提供公制。

在大多数情况下,除非您正在处理像GDP或国债等愚蠢的数字,否则这将为您提供小号。因此,为了使其更可管理,“公约”是乘以100,000。这为您提供了该地区每10万人的公制。和瞧,最大的地方每次都不赢。

怎么不错

有很多方法是错的,但只有一种正确的方式。在这里,我们将查看数据分析中最常见的一些缺陷以及如何避免它们。

  • 挑出支持一个角度的数据范围,同时忽略更大的趋势
  • 根据非代表性样本说出一些较大的群体
  • 使用少数少数少数 - 这是误导性的
  • 相关性并不相同的因果关系。即使我们没有说些什么导致其他东西,彼此相邻的两个趋势也会鼓励读者得出结论
  • 避免不必要的准确性:在计算中的一个数字是估计的一个数字时,取代小数点可能是欺骗性的
  • 不要将百分比点差(40% - 30%= 10个百分点)混淆,百分比变化(40%至30%是25%的减少)
  • 一般来说,使用百分比变化时要注意已有的值。这可以引入其他错误
  • 记录您的步骤,包括清楚地在哪里获得数据。网站隐藏部分很难找到
  • 确保您在百分比或分区中划分正确的数字
  • 标准化日期,包括在必要时将它们分解为日/月/年
  • 不要在可能的情况下键入事物并使用公式。用手输入数据引入错误
  • 在进行大变化后,点检查您的数据

数据驱动的内容应严格和准确。记者不会覆盖,让我们联系到,这些数字被欺骗的东西。尽可能小心是防止这种情况的最佳方式。

数据可视化

选择如何可视化您如此仔细收集和分析的数据是该过程中最重要的部分之一。毕竟,大多数人被电子表格关闭。让您的数据美丽是您想要的覆盖范围的另一个步骤。

你想告诉哪些故事是你选择的图表背后的主要司机。例如,条形图最适合于显示每个类别中的项目数,但是界图是显示数据如何随时间更改的选择。

如果您想要更大胆,还有其他的鸽友图表。 Choropleth图表使用颜色以在地理区域上可视化值,而SANKEY图表显示某种地方的某个地方(能量,金钱等)转移到另一个地方。

对于不同图表类型的优秀指南以及他们用于的东西,访问 数据可视化目录.

结论

上面的指南将帮助您将无聊的旧数字变为令人兴奋的内容活动。

要总结该过程,首先,找到一个伟大的数据集库再次返回给重新返回。然后,在查找想法时,查找相关的数据集,并查看它们是否引发想法或问题以回答。

准备分析的数据可能是最无聊,但最重要的是整个过程的一部分。使用所有Excel / Sheets Hacks您知道尽可能快速且简单地进行分析。

最后,选择合适的可视化技术,让链接滚动。好吧,你必须先开拓它,但这是另一天的故事。