题目为随机抽题 请用CTRL+F来搜索试题
形考任务一 网页数据是() 特征约简是在提高原有判别能力的前提下,从原有的特征中删除不重要或不相关的特征。() 余弦值越接近0,就表明夹角越接近0°,也就是两个向量越相似,当夹角等于0°时,即两个向量相等,称为余弦相似性。() 网站内部数据主要有()和() 数据科学不仅可以推动数学、计算机科学、统计学、天体信息学等学科的发展,而且又能够大力助推()的发展与进步。 数据获取与存储管理是大数据处理周期的第()步 NewSQL适用于() 奈奎斯特采样定理指出采样频率应该大于信号中最高频率的()倍时,采样之后的数字信号才能够完整地保留原始信号中的信息 维数约笥是使用编码机制来增大数据集的规模。() OldSQL适用于()
形考任务二 数据分片是由( )完成的。 虽然约简后的数据集变小了,而且不能保持原始数据的完整性,但在这样的数据集上挖掘,仍然能够获得与约简前相同的分析结果。() 数据挖掘主要注重解决分类、聚类、关联和定量定性预测等问题,其重点不是寻找未知的模式与规律。 回归分析是研究现象之间是否存在某种依存关系,并对有依存关系的现象,探讨其相关方向以及相关程度相关分析是一种统计判别的分组技术,根据就一定数量样本和相应的其他多元变量的已知信息进行判别分组。() 每一次计算请求称为() 离线计算模式中的已知数据存储于彩蛋 批量计算技术属于( )计算技术。 MapReduce模型适于()计算。 离线计算模式中的已知数据存储于() 批量计算技术属于()计算技术
形考任务三 MapReduce模型适于()计算 ()是结构化数据,网页是半结构化数据 大数据的5个“V”特性是数据量、多样性、()、速度、真实性 大数据主要来自()与互联网世界 Cyber空间是指以计算机技术、现代通信网络技术、()等信息技术的综合运用为基础,以知识和信息为内容的新型空间 数据科学是关于()的科学。 离线数据分析是指将待分析的数据先存储于硬盘中,然后进行数据分析,离线数据分析用于较复杂和耗时的数据分析和批处理。 探索性数据分析是从某种假设出发,去探索其内在的数据规律性。 数据分析是从一个假设岀发,需要自行选择方程或模型来与假设匹配,而数据挖掘不需要假设,可以自动建立模型。 数据规范化的主要方法是()、()和()等
形考任务四 大数据的5个“V”特性是数据量、多样性、()、速度、真实性 ()是结构化数据,网页是半结构化数据 网页数据是() 批量计算技术属于()计算技术 离线计算模式中的已知数据存储于() MapReduce模型适于()计算。 批量计算技术属于( )计算技术。 当两条不同的线出现了交叉点时,相交的问题就产生了。我们需要注重非交叉点信息的可视化展现。 通过将抽象的指标数据转换成我们熟悉的容易感知的数据时,用户便更不容易理解图形要表达的意义。 一幅图画最伟大的价值莫过于它能够使我们实际看到的内容比期望看到的内容丰富得多。()
|