摘要:当代社会,得数据者得天下。大数据时代背景下,当代网络编辑应具有数据化思维、整合思维、遗忘和取舍思维、寻找相关性与预测未来的新思维方式。
  关键词:大数据 网络编辑 数据化思维
  大数据标志着“信息社会终于名副其实”,它是移动互联网背景下理解人类新行为的途径,成为了人们获得新的认知、创造新的价值的源泉,它影响着人类的价值体系、生活方式、思维方式以及社会运转模式。
  面对无处不在的数据化趋势,作为当代网络编辑,必须要与时俱进,及时转变思维方式,拥有大数据思维。
  一、具有数据化思维
  数据,是记录信息的载体,是知识的来源。数据的激增意味着人类的记录范围、测量范围和分析范围在不断扩大,知识的边界在不断延伸。大数据之所以“大”,并不仅仅在于其“容量之大”,更多意义在于:人类可以分析和使用的数据在以惊人的速度不断增长,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”“大科技”,数据科学也正在发展为一个显性的新兴学科。可见,关于数据的知识,如何收集、分析、共享、保存、管理大数据将成为现代网络编辑的知识结构与素养中的必备要素。
  首先,网络编辑应认识到数字化不等于数据化。过去我们说的“数据”很大程度上是指“数字”,如我们所说的客户量、业务量、利润额等,都是一个个数字或者是可以进行编码的简单文本,这些数据分析起来相对简单,运用传统的数据解决方案,如数据库或商业智能技术就可以解决;而今天我们所说的“大数据”则不单纯指“数字”,还包括文本、图片、音频、视频等多种格式,并且它包含的内容丰富多样,如博客、微博、微信,以及里面的音频、视频分享、个人地理位置、个人日志与评论、内容偏好、交易信息等。如果说“数字化指的是把模拟数据转换成用0和1表示的二进制码”,数据化则是指一种把现象转变为可制表分析的量化形式的过程。数字化带来了数据化,但是数字化无法取代数据化。如亚马逊拥有数据化的书籍,却不曾挖掘书籍数据化之后的附加价值,它把眼光聚焦在用来阅读的书籍内容上,而不是分析数据化文本上。可以说,在某种意义上,亚马逊善于挖掘数字化内容的意义,而谷歌则触及到了数据化内容的价值。因而,数字化思维不等同于数据化思维,网络编辑在编辑文本时,不应简单地将其转化为数字化文本,而应树立“数据为王”的思维和意识,强调如何把信息或文本转化为可量化的、可分析数据,并在数据分析基础上形成决策和行动。
  其次,作为当代网络编辑,应尽力避免传统的“平面化思维”,学会多运用“数据新闻”来编辑、策划,它是对于数据抓取、搜索、储存、核实、分析,进行可视化的呈现。正所谓“一图胜千言”,相较于语言文字,有时,一个饼状图或条形图更容易让人明了事物的变化与发展趋势。可视化新闻的形象、生动和互动优势将化解复杂、抽象的数据,并使其具有“乘数效应”,可以更快更有效地抓住受众眼球,将信息变成一种核心竞争力。比如,百度“可视化大数据”上线,百度地图春节人口迁徙大数据于2014年1月26日正式上线,网民可以访问该专题页面,通过可视化大数据,了解全国春运的最新动态,包括当前春运最热的线路和流入、流出城市等。再如对报纸版面的视觉化的二次编辑,其核心是将版面的整体视觉感进行分拆,突出单个新闻本身的冲击力。
  此外,当前的数据呈现社交媒体化特征。作为数据存在最为密集的领域,社交媒体是当之无愧的大数据生产基地。数据化不仅能将人们的观念、态度和情绪转变为一种能够分析的形式,也可以转化为人类的行为。由于在当代日常生活中,大众几乎无法离开QQ、微博、微信等社交服务,大众的人脉关系、想法、喜好和生活模式被融入到巨大的个人信息库中,通过这些服务所记录的大数据,能毫无保留地展露出一个人的社交关系网。“通过社交网络邀请公众参与,获取更丰富的事实性信息,完成深度调查;通过互动平台和各种社会化媒体尽可能全面地获取观点性信息;通过社会网络寻求专家与同行的专业协作,以更深入地挖掘新闻的潜在意义”。
  在传统编辑思维中,一则新闻播出后,无法在很短时间内被大量阅读、转发、转载和点评。而在社交媒体裹挟下的大数据背景中,这些都在发生着巨大改变,加之当前读者的“社会化阅读方式”的兴起,伴随着微信出现产生的二维码技术,编辑可以把个人的博客网址,出版社、杂志社的官方微博、官方博客账户、电子邮箱、QQ号等大数据时代产生的信息,制作成二维码,放在杂志和图书的封底、书签等位置,读者可以通过手机扫描二维码,进行移动式阅读、浏览和下载,还方便编辑对内容的采集和信息的二次加工。此外,网络编辑还要对读者路径与行为进行大数据分析,学会从社交媒体的庞大数据财富中汲取灵感和智慧,去提炼其中有价值的信息,制定出有针对性的出版服务,以此更好地满足读者新的阅读行为及其习惯。
  二、运用整合思维
  在移动互联网时代,信息日益呈现“碎片化”状态,加之相较传统数据,大数据具有可变性、多层结构、不规则性和不确定性等特点。因而,对新闻报道话题和内容来说,尽管它们的时效性、焦点性、时尚性较强,但总体缺乏对议题的针对性、深入性和全面性,故常常是昙花一现,稍纵即逝。
  大数据的价值所在不是数据存储,而是数据应用。如果仅仅是简单地将这些数据存储起来,它本身并不具有任何价值。就像放在橱窗里的大蛋糕,人们只能站在外面垂涎欲滴和观赏。并且,由于每个人都拥有一定的变量数据,为了避免各自成为数据孤岛,只有通过对数据、信息的整合与分享才能变成你想要的有用数据。
  毫无疑问,大数据的潜在价值是巨大的,IBM执行总裁罗睿兰认为:“数据将成为一切行业当中决定胜负的根本因素,最终数据将成为人类至关重要的自然资源。”在国内,百度已经致力于开发自己的大数据处理和存储系统;腾讯提出如今已经到了数据化运营的黄金时期,整合这些数据成为未来的关键任务。
  “大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现”。大数据的要害之处不在其“大”,而在于如何通过整合让数据增值,在于对非结构化或半结构化数据的挖掘。这些庞大的异构数据中蕴含着巨大的财富,潜伏着惊人的信息。而与此同时,很大程度上,“技术的法则就是整合的法则”,新媒体就是一种“融合媒体”,新媒体环境下的编辑思维是十分复杂的,它是多种思维方式、方法相互结合和补充的产物。当前在新媒体中,尽管我们拥有的数据很多,但是缺乏真正能够从数据中发现和提取价值的能力。如果数据只是大而无当,结果也许会更差。因为,大众需要的是整合过的、精加工后的信息,而不是粗放的、碎片化的原始信息。比如传统媒体在向移动互联平台拓展时,常常需要通过二次编辑手法。不管是《京华时报》的“云拍”功能,还是《人民日报》的视频植入功能,都是在信息内容的第一次编辑——即传统图文编辑——过程中无法实现的,必须在二次编辑过程中进行添加和整合。如《海峡导报》已经加入《京华时报》“云拍”联盟,其已经开始组建全媒体报道中心,负责配合图文新闻生产音视频内容,作为“云拍”的内容数据库。
  总之,在自媒体对“把关人”理念不断削弱的背景下,对于大数据时代的网络编辑出版而言,如何最优化、更有效地利用大数据需要大数据思维与媒介素养,其中,具有整合性思维方式尤为重要。网络编辑要善于在数据化基础上通过文本挖掘技术对其呈现的语言、文化、社会现象进行量化整理、聚合和分析、处理,并从各种形式呈现的复杂数据中寻找到发展模式、规律,揭示其发展趋势,从而把大量散乱无序的非结构化数据转化为条理清晰的结构化数据。
  三、善于遗忘与取舍
  “数字技术赋予了我们前所未有的权利,它也产生了意想不到的可怕后果。Facebook上照片会被网络永远铭记,甚至会影响到一个人的职业发展;Google记得所有我们搜索过的信息和时间。数字王国记住了那些有时最好被遗忘的信息”。
  在大数据的领域里,是否数据量越大越好?大数据让人们能有足够开阔的思维、能力及视野,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间,但是大数据也很可能将我们禁锢在其中。对于大数据的具体应用而言,你用来分析的数据量越大,你能得到的东西就越多,但得到的那些东西是否是你所需要的,对你是否真有价值,没有人能确定。我们想收集什么和我们能收集什么并不等同。大数据的世界神奇和充满诱惑,如果你没有明确的目标去应用,则可能陷入五光十色的数据诱惑中而无法自拔。
  英国学者维克托·迈尔-舍恩伯格在《删除》一书中从大数据时代信息取舍的目的和方法诠释了人类“被遗忘的权利”。他回溯了人类追寻记忆的过程,提出了数字技术与全球网络正在瓦解我们天生的遗忘能力,并总结了促进遗忘终止的四大驱动力——数字化,廉价的存储器,易于提取,全球性访问。可以说,《删除》开启了一场“互联网遗忘运动”,该书告诉我们,在大数据时代,面对海量信息人类该如何取舍,怎样才能构建一个积极而安全的未来。显而易见,一个没有遗忘的时代是可怕的。自古以来,遗忘总是比记忆更简单,成本也更低。但数字时代却改变了这一切,让人类几乎丧失了遗忘的能力。无止境的数字记忆摧毁了历史,损害了我们的判断力和行为能力。“海量的数字化记忆不仅丝毫不费力,且比选择性删除所耗费的时间成本更低”。
  然而,如果人们真的记住一切,不仅让人无法想象,并且让人感觉更孤独、绝望……事实上,数量不等于质量,“好”信息不等于“滥”信息。对于网络编辑而言,应该尽力摆脱过去“信息越多越好”的思维惯习,而应充分认识到遗忘是一种美德,善于取舍更是一种能力,并在遗忘和取舍过程中成为真正的“信息管家”和“把关人”,如在选择和编辑文本时,“简约、凝练、有力”是其关键法则。总之,怎样避免数据灾难,舍弃无用的垃圾信息,保留有用的数据信息;怎样善于把有意义的留下来,把无意义的去掉是大数据时代环境下网络编辑面对的必然挑战。
  四、寻找相关性与预测未来
  在传统数据时代,调查公司和研究机构比较关注民众和媒体的使用之间的关联性、因果性,比如对儿童的收视行为进行调查、对媒体的设置议题进行统计和分析,这些调查研究结果大多会以图表等数据形式呈现。在欧美,早就出现了专门的社会调查机构,对数据进行采集和分析,如美国的尼尔森收视调查公司、皮尤研究中心等应运而生。在网络媒体发展之后,诸如Google、百度、HCR(慧聪研究)等公司,都提供专门对在线流量的统计和分析。
  在大数据时代,对网络编辑而言,首先要培养善于寻找相关性的思维方式。当前大量新闻事件中庞杂的网络数据、变量之间的复杂关系,已难以依靠传统的编辑手段来表达和处理。网络数据之间通常具有一定的相关性,当然,这种关联并非是简单的线性关系,而是一个复杂的曲线图。尽管大数据看起来又多又零乱,但内部必有关系可循,它是通过对海量信息的结构与重构,整合数据资源来完善决策流程。长期以来,人们习惯于去寻找新闻事件发生的来龙去脉、因果关系,而在大数据语境下,我们则不必纠缠于事件之间的因果关系,作为编辑,需要我们放弃只对事件因果关系的追寻,更多去关注它们之间的相关性与重要性,尽量“让数据自己发声”;去探索怎样利用大数据生产出对大众有益的内容,帮助人们更好地理解这个风云变幻的世界。例如,无论是稿件编辑中的“稿件配置”,还是版面设计中的“空间组合”与“反组合”(分立),体现的都是一种关联思维。在报纸编辑转型为多媒体融合编辑的条件下,处理多媒体文本更需要运用关联思维,以便利用不同形态文本之间的某种联系,来建构(组合)或解构(反组合)其中的关系,并通过诉诸视觉而呈现出某种意义。
  其次,网络编辑要具有前瞻性,善于预测未来。虽然万事万物皆显出自发偶然之态,但事实上它远比你想象中容易预测,因为历史总是惊人地相似或重复。预测是大数据的核心之一,“大数据”是一种收集和分析大量信息的能力,而这些信息关涉人类生活的各个方面,目的是从复杂的数据里找到事物发展规律而对未来进行预测。大数据成为了理解人类新行为的途径,纷杂的人类行为有迹可循,有一定固有的特点及模式,去发现未来。正如“亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,Facebook知道我们的喜好,而LinkedIn可以猜出我们认识谁”。大数据能够帮助网络找到关于新闻事件的良好相关关系,有利于我们捕捉现在和洞察未来。并且,过去通过建立在人的偏见基础上的关联物检测法已经不再可行,大数据的相关关系分析法更为客观、准确和快速,容易让人摆脱刻板印象和偏见,而不是基于经验和直觉。比如,无论是报纸稿件编辑中的“稿件配置”,还是版面设计中的“空间组合”,都体现出一种关联思维。通过这种关联性对未来进行的预测,能够启发编辑更加关注文本和社会现象之间的相关性,策划和编辑出更有价值的报道或版面。
  总之,大数据对网络编辑的思维与决策有着重要影响,大数据的决策系统通过对过去和现在的数据进行比对与剖析,洞察事物之间的关联性,能比较精确地预测未来。因此,网络编辑的思维应从传统以报道现象为主转为揭示事物规律,善于从浩如烟海的网络数据中去发现其中的相关性,挖掘出有价值信息,预测事件的发展趋势。如《金融时报》组建了超过30个人的数据团队并分成3个工作小组,对用户阅读的文章类型和频率进行相关性分析,把用户分门别类,据此推断读者的行为模式,并预测他们的选择趋向。通过对初始用户的跟踪分析,报纸逐步确定核心用户并有意引导他们成为订户。

 (来源:出版发行研究)