通过机器学习的大数据分析

MBA Skool Teabeplayer官网m出版 发布于2017年2月1日

在过去的几年中,大数据分析在确保业务增长、了解客户和探索新机会方面发挥了重要作用。World的数据每两年翻一番,而存储数据的成本也以大致相同的速度下降;现在,每家公司都在转变为数据公司,能够分析大型复杂数据,并在合理的成本内提供更快、更准确的见解。此外,机器学习一直是商业的一个关键方面。但企业的最新机遇是通过机器学习获得大数据分析(Big data Analytics)。



图片:pixabay

例如,特斯拉已经收集了7.8亿英里的驾驶数据,每10小时就会增加100万英里。最终,这些数据将成为他们计划于20181年发布的自动驾驶汽车的基础。


为什么机器学习是大数据分析的首选?

机器学习是一门让计算机无需明确编程就能行动的科学。它是大数据分析的首选,因为:

经典统计模型依赖于人类专家制定和测试一组输入和输出变量之间的关系,这个过程是基于一个基本假设和模型就变得不适合的数据量太大,因为任务的制定关系变得非常麻烦了。

然而,在机器学习中,它翻转整个过程,从输出变量本身开始;随后发现驱动这一结果的因素。因此,机器学习不受人类尺度思维的限制,它能够发现隐藏在数据中的模式,而这些模式很难从经典模型中提取出来

除此之外,机器学习模型具有随时间自动调整和改进的能力,这是经典统计模型所不具备的。

数据科学在各个领域利用机器学习

1.农业部门

在农业中利用机器学习

1.精准农业:精准农业允许农民,一种方法来处理每个领域和领域的变化。使用各种传感器,可以提取关于土壤湿度、土壤密度、空气质量、大农场一段时间内的温度等信息,机器学习可以用于:

•识别不同季节最适合的作物,以提供最大的产量

•确定最佳化肥使用水平,每英亩播种种子以获得最高产量。


2.准确的季风预测:多年来,印度开发的各种统计模型一直无法准确预测季风。对10年的预测数据进行分析后发现,IMD在6月至7月的“降雨范围”预测中有60%是错误的。因此,迫切需要利用机器学习技术建立更好的季风预测模型,能够处理大量的数据变量,如海面和陆地表面气温的历史数据、厄尔尼诺/厄尔尼娜的存在、云形成模式和预测结果,以更高的精度。


银行业

在银行业中利用机器学习

1.提高银行的盈利能力:通过机器学习,对客户的年龄、职业、工资、消费方式、储蓄方式、信用卡和借记卡使用方式等基本信息进行分析,可以得出:

•确定对银行来说最有利可图的共同客户群,并制定客户获取策略,特别关注于获取这些客户。

•根据客户过去的记录,预测客户拖欠贷款的可能性,并采取适当措施将违约风险降至最低,将减少银行的不良资产。

•识别单个用户的购买模式,并在偏离该模式时发出警报,从而在单个级别定制欺诈检测,这将减少虚假警报的实例,并提高现有欺诈检测模型的效率。


2.改善客户体验:通过机器学习的数据分析可以用于改善客户体验,具体如下:

•用人脸/语音识别取代传统的密码登录,让银行体验更高效。

•将最新的银行产品/金融产品与最有可能使用该产品的客户细分进行映射,不仅会提高银行的命中率,而且其客户将不再得到无关的产品/建议。


3.产品开发:利用机器学习分析来自呼叫中心的海量客户反馈数据和语音数据,可以根据客户不断变化的需求识别新的金融产品/服务。


国防部门

在国防中利用机器学习

1.从社交媒体应用中提取情报信息:机器学习技术可以从twitter、facebook、Instagram等社交网络中提取相关的情报信息,可以作为现有情报信息的补充,提供任何地方发生不必要事件的实时信息,为政府制定针对敌国的战略提供有用的数据。

2.无人机的使用:先进的机器学习算法可以帮助无人机/无人地面车辆在模式分析的帮助下导航通过未知领域,并通过安装在无人机上的传感器从周围收集的特设数据中过滤相关信息。


医疗行业

在医疗保健领域利用机器学习

1.患者的风险分析和更好的疾病诊断:使用患者的基本信息及其/家庭病史,机器学习可以用于:

•预测一个人未来最可能患哪种疾病,并建议在生活方式上做出必要的改变,以将这些风险降至最低。

•同时分析患者数据的组合,以提高诊断的准确性,并推荐处方药物的最佳剂量,在此过程中减少重复试验的数量,药物可能的副作用和降低医疗成本。


2.药物测试过程的探索:机器学习技术可以用于加快药物测试过程,通过绘制药物在所有可能的生物条件下对人体细胞的影响,以更低的成本和更好的效率。


机器学习的局限性

机器学习的一些局限性是:

1.不能保证机器学习算法在任何可能的情况下都能工作。它需要仔细理解手头的问题,以便应用正确的机器算法。

2.一些机器算法需要大量的训练数据,在某些情况下处理或收集如此大量的数据可能很麻烦。

3.深度学习算法(机器学习的分支)可以完全改变它们对输入数据的反应,即使是很小的变化,换句话说,深度神经网络可以很容易地愚弄自己,错误地把狮子标记为公共汽车。


本文由XIMB的Ankit Thakur撰写


参考文献

1.qz.com/694520/tesla - - 7.8亿英里的驾驶-数据-和-添加另一个百万——每- 10小时

2.beaconstac.com/2016/03/iot-ecosystem-iot-business-opportunities-and-forecasts-for-the-iot-market/

3.印度

4.IDC,麦肯锡全球研究所分析

5.pewinternet.org/2013/08/07/51-of-u-s-adults-bank-online

6.http://www.businessinsider.com/iot-ecosystem-internet-of-things-forecasts-and-business-opportunities-2016-2?IR=T

7.http://www.livescience.com/47071-drone-industry-spending-report.html

本节的文beplay体育时时彩章是由我们的作者。它们已经被MBA Skool团队审核和上传。beplayer官网MBA课程的内容仅为教育和学术beplayer官网目的而创建。

如果你有兴趣为我们写文章,beplay体育时时彩在这里提交


在以下内容分享本页:
Facebook分享 推特 分享在Linkedin