热门搜索： 2023 2024 2022 2025 无人机

您现在的位置是：团子下载站 > 其他 > 如何使用MapReduce进行大数据的主动学习

如何使用MapReduce进行大数据的主动学习

资源大小：0.73 MB
上传时间：2021-10-20
下载次数：0次
浏览次数：46次
资源积分：1积分
标签： 大数据函数算法

资源简介

针对传统的主动学习算法只能处理中小型数据集的问题，提出一种基于MapReduce的大数据主动学习算法。首先，在有类别标签的初始训练集上，用极限学习机（ ELM）算法训练一个分类器，并将其输出用软最大化函数变换为一个后验概率分布。然后，将无类别标签的大数据集划分为Z个子集，并部署到Z个云计算节点上。在每一个节点，用训练出的分类器并行地计算各个子集中样例的信息熵，并选择信息熵大的前q个样例进行类别标注，将标注类别的Z×q个样例添加到有类别标签的训练集中。重复以上步骤直到满足预定义的停止条件。在Artificial、Skin、Statlog和Poker 4个数据集上与基于ELM的主动学习算法进行了比较，结果显示，所提算法在4个数据集上均能完成主动样例选择，而基于ELM的主动学习算法只在规模最小的数据集上能完成主动样例选择。实验结果表明，所提算法优于基于极限学习机的主动学习算法。　　大数据具有以下几个特征：海量（ Volume）、多模态（Variety）、变化速度快（Velocity）、蕴含价值高（Value）和可靠性高（ Veracity）。在大数据环境下，传统的机器学习面临着巨大的挑战，其中也包括主动学习。主动学习算法大致可以分为两大类：基于池的主动学习算法和基于流的主动学习算法。

您可能感兴趣的

同类别推荐

Ellu Kniss 7天前成为了本站会员
叶落 1周前成为了本站会员
极 3周前成为了本站会员
Nick 1个月前成为了本站会员
云胡不喜 2个月前成为了本站会员
???麻麻 3个月前成为了本站会员
holodeck 4个月前成为了本站会员
justin 4个月前成为了本站会员
15319348679 成为了本站会员
最近很想吃重庆火锅成为了本站会员

my13297479 1个月前下载了：

GB∕T 2423.10-2019 环境试验第2部分：试验方法试验Fc：振动(正弦)
my13297479 1个月前下载了：

GB∕T 15970.7-2017 金属和合金的腐蚀应力腐蚀试验第7部分：慢应变速率试验
my13297479 1个月前下载了：

GB∕T 15970.1-2018 金属和合金的腐蚀应力腐蚀试验第1部分：试验方法总则
风信子 3个月前下载了：

GB 50603-2010 钢铁企业总图运输设计规范
haosbro 4个月前下载了：

ISO-TS16949-2002(E),汽车行业标准规范
haosbro 4个月前下载了：

TS16949七工具
holodeck 4个月前下载了：

GJB 3900A-2006 装备采购合同中质量保证要求的提出
469908533 4个月前下载了：

GB4706.1-1998 家用和类似用途电器的安全通用要求国家标准
justin 4个月前下载了：

filter-vhdl-code.rar为滤波器的完整VHDL程序
justin 4个月前下载了：

复阻抗负载滤波器综合及多工器设计应用

您现在的位置是：团子下载站 > 其他 > 如何使用MapReduce进行大数据的主动学习

如何使用MapReduce进行大数据的主动学习

资 源 简 介

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

资源简介

相关资源

您可能感兴趣的

同类别推荐