展开

新闻传媒期刊范文浅析新闻云方案设计

发布时间:2014-09-27   |  所属分类:新闻:论文发表  |  浏览:  |  加入收藏

  关键词:新闻传媒期刊范文,期刊杂志投稿,新闻云方案设计

  一、新闻云架构

  新闻云平台包括基础设施、管理平台、虚拟化、新闻应用四个子平台。基础设施平台主要包括计算、存储、网络等设备,是云平台的硬件支持系统。通过对基础设施平台的扩展,可进一步提高平台承载能力,同时支持网络热备、负载均衡、异构系统集成等关键技术研究。

  虚拟化平台主要通过虚拟化技术屏蔽底层的硬件差异,实现对计算和存储、网络和软件、数据和用户等资源的高效部署和管理,为用户使用提供稳定、良好的运行环境。通过虚拟化平台的建设,将进一步提高平台的整体运维能力,同时支持虚拟化、并行计算、分布式存储等关键技术的研究。云计算管理平台实现对所有资源的集中管理、监控和调度,同时提供完整的用户计算资源申请、审批、调配的服务流程管理。云平台通过虚拟机方式提供新闻浏览、查询、收藏、订阅和信息门户等服务。

  二、新闻云服务

  云端服务为客户端提供各种应用服务,能够充分和多样化地满足用户的需求,该应用服务包含浏览、查询、收藏和订阅四个选项标签。

  (一)浏览用户在登陆云端的虚拟平台之后可以按照自己的意愿和爱好来实时浏览和阅读新闻事件。阅读内容包含摘要、重大新闻、热图、视频、头条、音频和报种等。(1)报种:用户可以随意阅读诸如《重庆日报》、《重庆晚报》、《重庆晨报》等不同的报纸;(2)摘要:用户选择摘要浏览,目录服务器返回摘要列表,以供用户选择自己实际想要的摘要作为阅读内容;(3)重大新闻:用户申请重大新闻浏览服务,目录服务器会返回带有星级标识的重大新闻列表,重大新闻标识可由一星到五星分别用来表示新闻的重要性;(4)热图:根据用户的请求,服务器返回与用户输入的关键词有关的并且是当下搜索最为频繁的图片,由于所有的图片并非一定是用户实际搜索想要的,也考虑到服务器的响应速度和负载,所以此时返回缩略图,用户可以选择自己感兴趣的图片进而看到原图;(5)视频:根据用户的请求,服务器返回用户搜索的视频列表,有两种类型以供用户选择:普通画质和高清画质;(6)音频:根据用户的请求,服务器返回按照用户输入的关键词排序的音频列表,有两种类型以供用户选择:普通音质和高音质;(7)头条:根据用户输入的关键词,服务器将对新闻列表进行排序,随后返回对应的头条新闻列表。

  (二)查询除了实时阅读之外,用户还可以按照自己感兴趣的内容进行选择性查看。用户可以按照八个关键词形成的三种模式进行查询。三种模式为资源列表、形成文档和联合模式。八个关键词分别是时间、地点、人物、事件、类型、摘要、标签和连接符。(1)时间:用户可以按照事件发生的时间进行搜索;(2)地点:用户可以按照事件发生的地点查询;(3)人物:事件中涉及的主要人物;(4)事件:事件的总体概括;(5)类型:用户搜索的新闻媒体类型;(6)摘要:用户可以按照自己的需要查询摘要中的有关信息;(7)标签:用户查询时可以使用标签作为查询关键词,标签有五种,分别对应不同的重要等级的新闻;(8)连接符:连接同一新闻事件中不同新闻媒体的符号,允许用户搜索与当前查看内容为同一新闻事件的不同媒体类型。

  (三)收藏根据不同用户的需要,云服务向用户提供收藏服务。在该服务中,允许用户收藏前次浏览或者查询过程中标记过的书签和关键字,同时,系统会自动保存用户的浏览习惯,并借此自动设置用户的偏好。(四)订阅可以根据用户的不同需求,提供不同的订阅服务。订阅服务有三种类型:订阅摘要、订阅详细内容和自定义订阅。

  三、数据分析处理及存储

  当需要处理的数据来到数据处理中心,需要对其进行三个步骤的处理。首先,对数据进行预处理;其次,对数据所包含的同质以及异质新闻进行处理;最后,建立索引表并分配给服务器存储。

  (一)预处理在数据的预处理过程中,首先对数据进行格式标准化。所谓格式标准化就是将各种格式的数据转换为标准格式;然后再搜索敏感关键字,对于多次出现敏感关键字的新闻数据进行清理,删除错误的、负面的、不科学和不真实的数据。

  (二)同质新闻事件和异质新闻事件的处理对数据是否为同一新闻事件进行判断并处理,其过程如下:首先将预处理完成的数据进行内容比对,设定相异阈值M,内容相似度低于M的,则判定数据不是同一事件,然后对其建立索引并分布存储;设定相容阈值N,若不同数据之间相似度高于N,则判定数据重复,删除其中一个,只保留另外一个,将所有数据进行判定之后,进入下一步,建立索引。

  (三)建立索引并分布存储为上一步处理的所有数据建立索引,将所有数据的索引形成索引表存放在目录服务器中,用户向目录服务器递交服务申请,由目录服务器负责返回服务申请和数据地址映射。数据索引以特征字符串的形式组织和排序,在目录服务器形成索引表。特征字符串(其中数字为特征项长度,没有单位标识的,默认单位为字节)的格。

  特征字符串格式说明:在字符串中,每个字符都有每个字符的含义,具体内容如下:(1)时间:长度为8字节,格式为:yyyymmdd,年份4位,月份2位,日期2位;(2)地点:长度为20字节,每2个字节为一个汉字,若地点字数不足10字,则剩余字节加注结束标志;(3)人物:长度为10字节,每2个字节为一个汉字,若姓名字数不足5字,则剩余字节加注结束标志;4)事件:长度为20字节,每2个字节为一个汉字,若事件字数不足10字,则剩余字节加注结束标志;(5)摘要头:长度为1位,若为0则表示此项不是摘要头,为1则表示是摘要头;(6)正文头:长度为1位,若为0则表示此项不是正文头,为1则表示是正文头,摘要头和正文头不能相同;(7)连接符:长度为4字节,连接符表示是否有数据与当前数据关系相连(即陈述的是同一新闻事件),相同新闻事件的不同媒体之间的连接符相同;(8)标签:表示当前新闻事件的重要程度,分为5个等级;(9)校验位:长度为1位,用以校验特征字符串。将所有条目的特征字符串整合、排序并映射到主机地址和存储路径,形成索引表,存放在目录服务器,以便管理和用户查询。

转载请注明来自:http://www.uuqikan.com/xinwenlw/8084.html


上一篇:新闻理论论文电视新闻播报的开创性与约束性
下一篇:新闻传播投稿网络热词传播下的受众民意