原創(chuàng)|實(shí)施案例|編輯:況魚杰|2020-12-22 13:23:47.700|閱讀 274 次
概述:本文的目的是展示如何使用Cloudera機(jī)器學(xué)習(xí)(CML),運(yùn)行Cloudera數(shù)據(jù)平臺(tái)(CDP),建立一個(gè)基于高級(jí)機(jī)器學(xué)習(xí)概念的預(yù)測(cè)性維護(hù)模型。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
經(jīng)營一家大型商業(yè)航空公司需要對(duì)關(guān)鍵部分進(jìn)行復(fù)雜的管理,包括燃料期貨合同、飛機(jī)維護(hù)和客戶期望。僅美國的航空公司平均每天就有約45000個(gè)航班,每年運(yùn)送超過1000萬名乘客(資料來源:FAA)。航空公司通常是在利潤非常微薄的情況下運(yùn)營,任何航班延誤都會(huì)立即激怒或挫傷客戶。飛行本身并不危險(xiǎn),但失敗的后果卻是災(zāi)難性的。航空公司擁有如此復(fù)雜的商業(yè)模式,包含了精簡(jiǎn)供應(yīng)鏈、預(yù)測(cè)性維護(hù)和堅(jiān)定不移的客戶滿意度的文化。
為了最大限度地保障所有乘客和機(jī)組人員的安全,同時(shí)也為他們帶來利潤,航空公司在預(yù)測(cè)分析方面進(jìn)行了大量投資,以深入了解維持發(fā)動(dòng)機(jī)實(shí)時(shí)性能的最具成本效益的方式。此外,航空公司還通過利用漢莎技術(shù)公司等維護(hù)、大修和維修(MRO)機(jī)構(gòu),確保其機(jī)隊(duì)的可用性和可靠性。
漢莎技術(shù)公司是一家MRO公司,它與Cloudera合作建立了一個(gè)預(yù)測(cè)性維護(hù)平臺(tái),為其全球800個(gè)MRO設(shè)施網(wǎng)絡(luò)中的5000架飛機(jī)提供服務(wù)。Lufthansa Technik擴(kuò)展了在飛機(jī)發(fā)動(dòng)機(jī)上放置傳感器的標(biāo)準(zhǔn)做法,并使預(yù)測(cè)性維護(hù)能夠自動(dòng)執(zhí)行解決方案。通過將深厚的航空公司運(yùn)營專業(yè)知識(shí)、數(shù)據(jù)科學(xué)和發(fā)動(dòng)機(jī)分析結(jié)合到預(yù)測(cè)性維護(hù)計(jì)劃中,漢莎技術(shù)公司現(xiàn)在可以確保關(guān)鍵部件在需要的時(shí)候在地面上(OTG),而不是整架飛機(jī)都在OTG,不能產(chǎn)生收益。
本文的目的是展示如何使用Cloudera機(jī)器學(xué)習(xí)(CML),運(yùn)行Cloudera數(shù)據(jù)平臺(tái)(CDP),建立一個(gè)基于高級(jí)機(jī)器學(xué)習(xí)概念的預(yù)測(cè)性維護(hù)模型。
許多公司利用庫建立機(jī)器學(xué)習(xí)模型,無論是為自主車輛建立感知層,讓車輛自主運(yùn)行,還是為復(fù)雜的噴氣發(fā)動(dòng)機(jī)建模。Kaggle是一個(gè)為構(gòu)建機(jī)器學(xué)習(xí)模型提供測(cè)試訓(xùn)練數(shù)據(jù)集的網(wǎng)站,它提供了來自NASA的模擬數(shù)據(jù)集,用于測(cè)量渦輪風(fēng)扇噴氣發(fā)動(dòng)機(jī)的發(fā)動(dòng)機(jī)部件退化。本博客中的模型是基于CML建立的,是基于輸入各種發(fā)動(dòng)機(jī)參數(shù),顯示發(fā)動(dòng)機(jī)溫度、油耗、振動(dòng)或燃料與氧氣混合的典型傳感器值(見下圖)。需要注意的一點(diǎn)是,"故障 "一詞并不意味著災(zāi)難性的故障,而是指其某一部件(泵、值等)沒有按照規(guī)范運(yùn)行。航空公司在設(shè)計(jì)飛機(jī)時(shí),都是以99.999%的可靠性運(yùn)行的。
首先,組織了4組不同條件和故障模式的測(cè)試和訓(xùn)練數(shù)據(jù),為CML做準(zhǔn)備(見下圖中的方框1)。
每一組訓(xùn)練數(shù)據(jù)都顯示了每次飛行的發(fā)動(dòng)機(jī)參數(shù),同時(shí)每臺(tái)發(fā)動(dòng)機(jī)都要 "飛行",直到發(fā)動(dòng)機(jī)部件發(fā)出故障信號(hào)。這是在海平面和所有飛行條件下完成的。這些數(shù)據(jù)將用于訓(xùn)練模型,以預(yù)測(cè)給定的發(fā)動(dòng)機(jī)在故障前有多少次飛行。
對(duì)于每個(gè)訓(xùn)練集,都有一個(gè)相應(yīng)的測(cè)試數(shù)據(jù)集,它提供了100臺(tái)處于不同壽命階段的噴氣發(fā)動(dòng)機(jī)的數(shù)據(jù),并提供了實(shí)際值,用于測(cè)試預(yù)測(cè)模型的準(zhǔn)確性。
CML被用來創(chuàng)建一個(gè)模型,利用所提供的測(cè)試和訓(xùn)練數(shù)據(jù)集來估計(jì)給定發(fā)動(dòng)機(jī)的剩余使用壽命(RUL)。一個(gè)星期的閾值--將部件放置在地面上的時(shí)間允許--計(jì)劃用于在潛在的發(fā)動(dòng)機(jī)部件故障之前向航空公司發(fā)出警報(bào)的場(chǎng)景。假設(shè)每天有四個(gè)航班,這意味著航空公司希望有把握地知道一個(gè)發(fā)動(dòng)機(jī)是否會(huì)在40個(gè)航班內(nèi)發(fā)生故障。對(duì)每臺(tái)發(fā)動(dòng)機(jī)進(jìn)行了模型測(cè)試,并將結(jié)果分為40次飛行內(nèi)潛在故障的真假(見下表)。
在沒有預(yù)防性維護(hù)的情況下,發(fā)動(dòng)機(jī)壽命耗盡或發(fā)生故障會(huì)影響安全,更換一臺(tái)發(fā)動(dòng)機(jī)的費(fèi)用要多出數(shù)百萬美元。如果在發(fā)動(dòng)機(jī)壽命耗盡之前對(duì)其進(jìn)行保養(yǎng)或大修,大修費(fèi)用會(huì)大大降低。然而,如果發(fā)動(dòng)機(jī)過早地進(jìn)行大修,則有可能還能利用發(fā)動(dòng)機(jī)的壽命。本模型中對(duì)上述每種大修結(jié)果的估計(jì)成本見下圖(見下圖)。
使用Cloudera機(jī)器學(xué)習(xí)(CML)來分析Kaggle提供的NASA噴氣發(fā)動(dòng)機(jī)模擬數(shù)據(jù),預(yù)測(cè)性維護(hù)模型以非常高的準(zhǔn)確性預(yù)測(cè)了發(fā)動(dòng)機(jī)何時(shí)可能出現(xiàn)故障或何時(shí)需要大修。將成本效益分析與該預(yù)測(cè)模型與測(cè)試數(shù)據(jù)集相結(jié)合,表明在所有應(yīng)用場(chǎng)景中都能顯著節(jié)省成本。航空公司在做決策時(shí),總是先考慮安全,再考慮利潤。預(yù)測(cè)性維護(hù)是首選,因?yàn)樗偸亲畎踩倪x擇,而且與被動(dòng)式(故障后更換發(fā)動(dòng)機(jī))或主動(dòng)式(更換發(fā)動(dòng)機(jī)前更換部件)相比,它的維護(hù)成本大大降低。
在 Cloudera,我們相信數(shù)據(jù)可以使今天的不可能,在明天成為可能。我們使人們能夠?qū)?fù)雜的數(shù)據(jù)轉(zhuǎn)換為清晰而可行的洞察力。Cloudera 為任何地方的任何數(shù)據(jù)從邊緣到人工智能提供企業(yè)數(shù)據(jù)云平臺(tái)服務(wù)。在開源社區(qū)不懈創(chuàng)新的支持下,Cloudera推動(dòng)了全球最大型企業(yè)的數(shù)字化轉(zhuǎn)型歷程。
慧都大數(shù)據(jù)專業(yè)團(tuán)隊(duì)為企業(yè)提供Cloudera大數(shù)據(jù)平臺(tái)搭建,免費(fèi)業(yè)務(wù)咨詢,定制開發(fā)等完整服務(wù),快速、輕松、低成本將任何Hadoop集群從試用階段轉(zhuǎn)移到生產(chǎn)階段。
歡迎撥打慧都熱線023-68661681或咨詢慧都在線客服,我們有專業(yè)的大數(shù)據(jù)團(tuán)隊(duì),為您提供免費(fèi)大數(shù)據(jù)相關(guān)業(yè)務(wù)咨詢!
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn