AutoML(自動機器學習)是深度學習的新方式,利用大數據分析、高性能計算、數據管理、算法、邊緣計算等技術。有了AutoML,我們就不再需要設計復雜的深度學習網絡,用于數據采集、數據預處理、優化、應用、人工智能和機器識別等領域。AutoML是將機器學習應用于現實問題的端到端流程自動化的過程。

中國的人工智能市場
與美國相比,中國人工智能軟件市場的規模接近美國60%以上。與中國軟件市場占全球規模的比重相比,人工智能領域的創新成果顯著。預計2020-2025年,中國人工智能市場復合增長率將達到35.2%,仍占據全球主導地位。

從整體解決方案來看,2020年人工智能技術支出已經占到行業企業IT支出的5.2%,預計到2024年,與AI相關的技術支出將占IT總支出的9.1%。從客戶服務到運營流程,從生產制造到IT支撐部門,越來越多的組織中的業務流程和數字化應用正在集成或嵌入機器學習和AI技術,以支持業務智能決策。


企業級AutoML需具備的能力
如今,大多數用戶對AutoML的概念和現狀沒有清晰的認識。結合當前產品和行業用戶智能化現狀的基礎上,小藍認為現階段企業級AutoML產品必須具備六大能力,遵循機器學習發展流程的基礎之上:適配行業屬性、開放靈活、低代碼易上手、可視化效果好、效率與成本平衡、支持快速部署。


AutoML最佳實踐
某省銀行
截至2020年末,該行總資產7574.83億元人民幣,下轄18家分行、2家直屬支行,共494個營業網點。2018年以來,該銀行啟動數字化轉型,成立數據銀行部。目前AI團隊規模在70人左右。堅持自主研發創新的發展路線,金融科技能力處于國內城市銀行領先水平。
2018年以來,該銀行采用開源社區的Zeppelin系統,實現了小規模、非協作的機器學習模型的開發。隨著數據智能應用建設的加速,為實現企業級AI協同和云原生AI服務,2019年某省銀行搭建企業級機器學習平臺。該平臺作為企業級模型開發和運營平臺,為數據科學家和建模者提供處理后的數據,為上層業務應用提供接口工具。
主要在三個方向部署應用:
1)在營銷方向:平臺開發營銷類模型、生產營銷資源和話術,為客戶經理提供產品銷售預測和潛在客戶名單篩選,實現數字化營銷。
2)在運營方向上:采用OCR識別技術,讓開戶轉賬更加便捷,采用NLP技術,支持電話智能客服,優化升級智能知識庫,利用預測模型,在網點智能派發現金,實現運營流程自動化。
3)在風控方向:平臺上部署了信用記分卡等模型,基于DL算法進行聯合建模,后者已實現拒絕回撈客戶數萬戶,累計放款數千萬人民幣。目前,該銀行自主研發了數十個機器學習項目,發布了OCR、NLP等數十項AI服務,日均調用數千次,場景工作量替代率達到70%,賦能全行業務數字化轉型升級。
在AutoML方面,該銀行使用DataCanvas的AutoML工具DAT,目前的效果主要體現在自動特征衍生和數據處理環節。目前該銀行AI應用開發中最費時費力的部分是數據準備和特征選擇環節。當具備場景和數據可用時,DAT可以幫助業務分析師直接上手應用程序開發。同時,DAT還可以幫助建模工程師處理特征和優化超參數。目前能節省20-30%的工作量,預計未來提效會更加明顯。

某航空公司
該航空公司在多年的運營過程中積累了大量的數據。在智能化轉型升級過程中,與高校、外部伙伴合作開發AI算法模型,探索智能化應用。
應用主要關注三種場景:
1)運行類:在燃油消耗管理的應用中,機載飛行數據記錄儀QAR記錄飛行參數數據,基于機器學習算法的航班燃油消耗影響因素模型可以通過分析這些數據為燃油精細化管理提供決策支持,實現單條航線在一個月內節省數十噸航油的成果。
2)飛機維修類:在發動機損傷識別場景中,需要采用工業視頻內窺鏡伸入發動機上預留的觀察孔進行觀察、拍攝圖像,并通過基于深度學習的圖像分析算法識別劃痕的生長等情況,可以提高故障診斷的效率。2021年5月,該航空公司《數據驅動飛機健康監控與預測維修關鍵技術》獲得2019年民航科學技術獎(民航全行業科技類的唯一獎項)一等獎,實現了民航維修領域的技術創新和能力突破。
3)營銷類:營銷部門人員正在AutoML開發AI算法,將用于票價分析、旅客人數預測等營銷場景,其中人數預測模型也可用于飛機動態備餐場景。

某股份制銀行
該行基于AutoML賦能多個行內數字化轉型場景,如營銷領域的產品推薦、風險控制領域的貸款違約率預測、反欺詐反洗錢、內部管理領域的現金流預測和員工行為監控管理。
基于AutoML,該行的開發人員可以基于平臺的工作流使用已有算子快速定制、訓練模型,對定制化開源模型進行統一的開發和管理,從而降低數據建模的門檻,減少代碼量,提高建模效率。具體在模型訓練方面,對于數量較小的模型仍然采用單機建模訓練,對于Spark框架中樣本超過百萬的模型進行分布式訓練。隨著平臺加快模型訓練和部署,從模型構建、部署到生產應用的時間從1-2個月縮短到2-3周。從業務價值的角度來看,營銷A/B測試表明,與業務專家的經驗相比,該模型在客戶引流和風險交易管理方面帶來了顯著的改善。


AutoML加速您的AI應用上線
在AI人才還不充足的今天,采用AutoML能夠幫助組織快速形成AI能力,提高開發效率,降低需要人工操作的任務量,促進機器學習民主化等等。從機器學習開發流程的角度,AutoML可以減少人類在設計機器學習模型時出現的偏差和錯誤;企業也可以通過應用AutoML來降低雇傭高級專家的成本。隨著組織中需要管理的模型數量的增長以及日益增加的應用AI實現智能化升級的需求,有必要考慮引入AutoML工具,加速智能化應用的部署上線。
藍海大腦利用大數據分析、高性能計算、數據管理、算法、邊緣計算等技術,自主研發的液冷GPU服務器為AutoML提供硬件保證。

|