当前位置:首页 >课程 >大数据算法

1、关于单词共现矩阵的计算,说法正确的是()。

A、计算文本集合中词的共现矩阵
B、词的个数如果为N,输出为M*N的矩阵
C、是一种测量语义距离的方法
D、语义距离可用于许多语言处理任务

参考答案:请扫码使用小程序查看答案

2、用单词共现矩阵解决大规模计数问题的基本方法是()。

A、Mapper生成部分计数
B、Reducer生成部分计数
C、Reducer聚合部分计数
D、Mapper聚合部分计数

参考答案:请扫码使用小程序查看答案

3、“条纹法”的优点有()。

A、易于实现
B、对key-value对的排序和洗牌少得多
C、潜在对象更大
D、能更好地利用combiner

参考答案:请扫码使用小程序查看答案

4、在“词对法”中,每个mapper处理一个句子。()

参考答案:请扫码使用小程序查看答案

5、“词对法”的缺点是不易实现,排序和洗牌代价高。()

参考答案:请扫码使用小程序查看答案

6、f(B|A)词对法必须确定所有a被传递到同一个combiner。()

参考答案:请扫码使用小程序查看答案