11月21日上午,首届中国(北京)国际视听大会“文化大数据产业论坛”在京召开,来自政界、学界和实业界代表共商推动文化大数据产业发展大计。中宣部文改办一级巡视员、副主任高书生受邀出席论坛,并以《文化大数据建设:不一般的新基建》为题发表主旨演讲。以下为演讲实录。
2018年年底,中央经济工作会议提出建设新型基础设施(简称新基建)。2020年3月,为了应对新冠疫情,统筹疫情防控和经济社会发展,中央政治局常委会议明确要加快建设新基建,包括5G和数据中心建设。文化大数据建设充分体现了党中央的决策部署,是宣传文化战线的新基建,目的是为了适应新时代文化建设的新要求,顺应文化和科技深度融合的新趋势,夯实宣传文化事业发展的信息化基础。
文化大数据建设的体系架构
有五个关键词:供给端、生产端、需求端、云端以及有线电视网络,四个端是通过有线电视网络来连接到一起。关于文化大数据大家都觉得很复杂,其实很简单,就是四个端+有线电视网络。
供给端可形象的比喻为“开矿淘金”,这是文化大数据跟其他的大数据最大的不同。供给端主要是建三个库:第一是中国文化遗产标本库;第二是中华民族文化基因库;第三是中华文化素材库。
中国文化遗产标本库,主要是依托现有的工作基础,把这些年来国家开展多次文化资源普查取得的数据,导入国家文化大数据体系底层关联集成系统,对普查数据作标准化、结构化处理,不需要再投入数据采集资金。
中华民族文化基因库,主要是对革命博物馆纪念馆以及国家一级博物馆收藏的珍贵文物进行高精度数据采集,导入国家文化大数据体系底层关联集成系统,完成标注、关联,提取中华文化的元素、符号和标识,形成中华民族文化基因库。
中华文化素材库的来源是多元化的,其中一个途径就是通过对中国文化遗产标本库和中华民族文化基因库积累的数据进行解构,形成中华文化素材库。此外,目前许多文化机构建成了各类数据库,但都是数据“孤岛”,如果把数据导入国家文化大数据体系底层关联集成系统,就可以通过有线电视网络实现全国联网,在全国范围内展示、开发和变现,挖掘和发现数据的价值。
主要包括三个方面的内容:第一个是数据采集和清理,第二个是数据标注和关联,第三个是数据解构和重构。这三项统称为数字化文化生产线,从生产端导出生产线。
就是利用新技术、新装备,打造场景化、沉浸式、互动性的文化体验场景:
第一个就是文化体验园,规模比较大,主要是在旅游景区和旅游度假村。把通过生产线加工的文化产品,“活化”到旅游景区。文化体验园不等于主题公园,最大的区别是内容在不断更新,天天更新、时时更新,因为有一个庞大的生产体系在支撑。
第二个是文化体验馆,第一面向中小学,第二面向商场,中小学提出传统文化进校园,红色文化进校园,戏曲进校园,怎么进呢?进教材容量有限,可比照电教馆的模式建文化体验馆。现在的商场都在转型升级,这也是文化体验馆落户商场非常好的时机。
第三个是文化体验厅,主要面向社区,包括城市社区和农村社区,农村的农家书屋、新时代文明实践中心、县级文化馆、文化礼堂、文化大院等等,这都是基层的文化体验厅,再有就是新华书店,特别是每个家庭的客厅,这都是将来发展的空间。
主要是依托有线电视网络来架构一个云端,或者叫国家文化专网。国家文化专网包括三个层次:第一个是省域中心,任务是把本省内的供给端、生产端、需求端连到一起,实现数据、产品的确权、交易和结算、支付。第二个是区域中心,目前已授牌8个,其中6个是行政大区类的区域中心,还有2个是专业化中心,他们的任务就是把省域中心连到一起,达到承上启下,上连接全国中心,下连接省域中心。最后一个就是全国中心,区域中心的基础之上形成全国中心——国家文化大数据体系的中枢。
文化大数据建设遵循国家大数据建设的一般原则,最主要有两个特点
现在大量的数据实际上是分散在各个文化机构,包括公共文化机构和文化生产机构,像电视台、出版社、演出公司、设计公司等等。如果把数据集中到一起,既不现实也不必要,遵循物理分散的原则,各个文化机构自建或租赁数据中心,但必须逻辑集中,执行国家文化大数据体系的一系列标准,当前最重要的是导入国家文化大数据体系的底层关联集成系统,第一标识每个数据,第二实现数据之间的关联,第三数据能够解析。
这跟全国大数据建设一致,就是要建设全国一体化的数据中心,布局区域级数据中心集群和智能计算中心。
文化大数据建设跟其他大数据建设不一样的地方
正是这些不一样,彰显其是不一般的新基建:
第一,数据主要不是来自于需求侧,而是来自于供给侧。一般大数据都是来自于消费所产生的数据,比如说给用户画像等等。文化大数据最主要的数据是供给侧的数据,是从唐古拉山开采的数据。这是跟其他大数据最大的不同,比如中华传统纹样、文物藏品图像、红色经典影像、珍贵历史影像、中华经典古籍、古代服饰图解、传统农具图鉴等等,都是供给侧的。所以,文化大数据建设本质上属于供给侧结构性改革范畴。
第二,国家文化专网不只是消费互联网,首先是生产互联网。顺应时代发展,特别是信息技术的发展,我们要做生产网,也就是时下热门的“产业互联网”,产业互联网就是生产互联网,因为跟消费对应的是生产,既然有消费互联网,相对应的就是生产互联网。
第三,文化大数据体系不是封闭系统,而是开放体系。现在大家有些疑虑,说做国家文化专网,而且在文化生产上又是闭环的,是不是就是封闭的?首先说闭环不等于封闭,闭环是为了数据的安全。其次,中国文化遗产标本库和中华民族文化基因库是国家所有的具有公益属性的专业数据库,是国家出资建设的。现在一讲数据,大家提的第一个问题就是版权怎么解决,三个数据库当中,中国文化遗产标本库和中华民族文化基因库的数据都是财政出资采集的,有版权也应该是公有版权,不是私有版权。再次,生产线守正不守旧,在内容上要确保守正,数据要保真、创作要严谨、互动要有序、内容要把关。同时我们坚持创新。最后,生产闭环、消费开环,要保证数据的安全必然是闭环,但是消费必须是开环的。
文化大数据不是从零开始,是十年磨一剑
1、早在2010年,国家“十二五”文化改革发展规划纲要当中,就已明确提出文化数字化建设工程,任务是推动从文化资源到文化生产、文化传播、文化消费的全面数字化,这比当下的产业数字化、数字产业化,在时间上要早好几年。这些年来,文化建设的许多做法走在了其他行业前列,很超前,只是有些部门和人员因为戴着有色眼镜,看不清甚至不想看。
2、从2012年开始,我们在北京歌华有线开展电视图书馆试验,2017年扩大到天津、重庆、吉林等九个省市区,覆盖近五千万高清互动用户,1亿多群众通过电视机终端可看到170万中文数字图书、20多万集视频,每个月可以更新10本数字图书。实践证明,完全可以用产业化的方式提供公益性服务。按国际图联的标准,公共图书馆人均藏书量应该在1.5到2.5册,2015年我们只有0.75册。即使不算170万种中文图书(相当于把国家图书馆搬回家),只算每个月更新10本,一年就是120本,每个家庭按三口人算的话就是人均40本,远远超过国际标准。通过电视图书馆试验还证明一个道理,电视不仅可以看,还可以用,从看电视到用电视,完全可行。时下经常会听到一种说法:现在谁还看电视,这种说法不能解释两个问题:一是每年千万台电视机销量,二是电视机的清晰度不断跃升,从标清到高清再到超高清,从4K到8K。
3、从2013年开始,我们推动出版业数字化转型升级,对出版社的业务流程进行再造,对出版社的资源进行数据化,建成若干个数据库,这些数据库是中华文化素材库的重要来源。
4、2019年,《文化产业促进法(草案)》和国务院向全国人大报告文化产业发展工作,以及科技部、中宣部、中央网信办、财政部、文旅部、广电总局出台的《关于推动文化和科技深度融合的指导意见》,都提到加快国家文化大数据体系建设的任务。
理解国家文化大数据体系的“密钥”
1、数据是核心要素。
2、关联数据是核心资产。文化大数据当中最有价值的是关联数据,也就是导入国家文化大数据体系底层关联集成系统,经过标识、专业标注、关联的数据。
3、数据关联是核心生产力。数字化文化生产线的重要职能是把数据关联到一起,绘制关联图谱,在这个过程中产生的生产力,就是文化大数据体系的核心生产力。
4、数据变现是核心驱动力。数据不能变现,就是死数据。
5、数据安全是核心竞争力。数据不安全,就不会有文化机构愿意把数据导入体系之中,这也是为什么必须建设国家文化专网,为什么文化生产一定要闭环的根本原因。
6、生产端、生产线、生产网是核心环节。
文章来源丨伏羲云