文数字,以现在的科学手段根本无法完全处理。
为了解决这个问题,现在的数据都是经过一定步骤的筛选获得的“有效数据”。
但是无论任何数据,只要经过筛选,一定会丢失一部分信息。
有的时候,这些丢失的信息反而是那些最关键的信息。
那么经过筛选之后的“有效信息”就会变成错误信息。
最后由这些信息得出的结论有极大的概率也是错误的,甚至有可能与真相完全相反。
所以使用大数据的手段来探求真相,最关键的有两个方面。
第一个就是尽可能多的使用原始数据。
舍弃的数据越少,丢失的信息也就越少,能够得到的结论也就越接近真相。
第二个则是尽可能的使用更加准确的标准。
标准越是准确,越能将得到的数据进行正确的判断。
无梦解忧的相关数据很多,需要进行筛选,而筛选的模型是由陈丹青的经验来判断的。
这个筛选模型究竟合不合理尚且未知。
而且比对的标准同样也是依照陈丹青的经验得出的“重叠率最高”。
所以经过大数据统计之后得出的结论究竟正确与否,完全取决于陈丹青的经验是否准确。
过了不久,凉子说道:“已经统计出来了!”
“怎么样,结果如何?”陈丹青问到。
“合作超过两次的势力一共有四十七个,合作最高的有四个势力,他们都占了20%左右。”
这……
陈丹青最担心的事情发生了,他们筛选的条件特异性不够,不能完全将错误答案筛选掉。
看来还需要再筛选一次。
“有哪四个势力,显示出来看看。”
“好的。”
陈丹青的视网膜上出现了一个表格,里面写着四个势力的名字与合作的内容等等一系列数据。
就在他思考着这些数据中可能存在的联系的时候,身后的合金门突然打开。
一个身影走了进来:“谁在哪?!”
……
“队、队长……快!你后面!”西科姆惊呼一声。
马克洛夫紧忙回过身去。
只见白色的雾气逐渐散去,里面有一个黑色人影一步步走了出来。
人影破开迷雾,显露出他的真容。
人影不是别人,正是西法。
此时的西法衣服多有破损,画满油彩的精壮身躯袒露在外,油光瓦亮。
虽然看上去有些狼狈,但是西法明显没有受到很严重的伤害。
他舔舔嘴唇,一脸的兴奋:“不错啊不错啊,我得承认我