2018年的春晚,王菲和那英再度聚首合唱了一首《歲月》,讓觀眾又想起20年前,王菲和那英合唱那首廣為傳唱的《相約1998》。同樣是將近20年的歷史,1997年,IBM(深藍)戰勝了國際象棋世界冠軍Garry Kasparov,代表了基于規則的人工智能的首次勝利,2016年,谷歌的AlphaGo機器人在圍棋比賽中擊敗了世界冠軍李世石,至今維持不敗戰績。如果要問未來20年,影響我們生活的最大技術驅動力是什么?答案就是人工智能(Artificial Intelligence)。
人工智能是指使用機器代替人類實現認知、識別、分析、決策等功能,對人類思維和推理過程的模擬、延伸和擴展,是一門綜合了機器學習、云計算、大數據等前沿交叉學科技術。人工智能的過程就是機器模仿人類利用知識完成了一定行為的過程。按照是否能真正實現推理、思考和解決問題這一標準,人工智能分為“弱人工智能”和“強人工智能”,目前市場上的人工智能研發和應用主要集中于“弱人工智能”領域,即是實現特定功能的專用人工智能,如語音識別、圖像處理、機器翻譯等。
與傳統的人工控制或遙控機器人相比,人工智能系統同樣需要數據和計算,同樣需要與人產生互動協作,但人工智能系統更高級之處,在于具有一定的自適應特性和學習能力,能夠隨環境、數據或任務的變化而自適應調節參數或更新優化模型,能夠向“云、端、人、物”進行數字化連接并擴展、實現演化迭代,應對不斷變化的現實環境,從“一器一用”向“一器百用”過渡,這就是“智能”的體現。
以上是對人工智能的整體介紹,下面我們以“拆文解字”的方式,再來剖析一下人工智能的各個方面:
1. 人工智能的“人”:可以理解為機器所替代的各種人類活動場景,由此派生出了各種結合人工智能應用場景,包括“AI+醫療”、“AI+金融”、“AI+物流”、“AI+制造”等各種領域。
在“AI+醫療”領域,人工智能技術在醫療影像輔助診斷、輔助診療、疾病預測、藥物開發方面,能夠有效提高醫護人員的工作效率,降低漏診率和誤診率。比如在醫學影像領域,我國影像數據的年增長率約為30%,而放射科醫師數量年增長率為4.1%,放射科醫師有超過一半以上工作時間在 8小時以上,20%每日工作時間甚至超過 10小時,一個病人的肺部CT影像,看完需要15~30分鐘,而通過人工智能技術的輔助,影像醫生的工作效率可以提高3倍多。
在“AI+金融”領域,人工智能技術在智能獲客、身份識別、大數據風控、智能投顧等方面都取得了一定的進展。以大數據風控為例,傳統銀行的風控打分還維持在在20~200個左右的模型變量,而基于深度學習的模型可以處理的特征變量多達7萬個,通過人工智能的算法,模型還可以發現一些傳統模型無法預警到的風險現象,比如,在美國市場的小額現金貸發放中,機器學習會發現貸款申請人在網上填表喜歡全部用大寫字母的人違約率更高,或者在申請人月收入沒有驗證的情況下,申請人填寫月收入超過7500美元以上的人違約率反而會提高,預示著一種可能存在欺詐的統計現象。
2. 人工智能的“工”:可以理解為“工效”指標,即KPI,這是衡量機器輔助或替代人類活動后工效指標。
通過人工智能能夠非常明顯提高工效的活動,除了上面提到的醫學影像輔助診斷之外,客服行業也是一個非常好的案例,通過歷史上積累的客服對話記錄,人工智能技術能夠在意圖識別、命名實體識別、自動問答、用戶畫像等方面進行賦能,可以提高20%~30%的工時效率,通過人機充分協作,機器人不僅可以獨立解決客戶問題,還能輔助人工發揮重要作用,90%以上的問題將可以由機器人自主解決。
不僅僅在服務領域有“工效”問題,在智能硬件出也能體現中“使用效果”的提升,比如在2018年1月9日美國拉斯維加斯舉辦的國際消費類電子產品展覽會(CES)上,一家Forward-X的公司就推出了一款可以跟隨主人滑行的智能行李箱。這款行李箱采用面部識別技術、傳感器與自動駕駛技術,可以避開障礙物,用攝像機和激光雷達進行定位,實時鎖定并跟隨主人。而且用戶通過獨特的手勢控制功能就可以控制它。此外,智能行李箱還配備了一個警報腕帶,如果有人試圖偷走它就可以報警。有了智能旅行箱,出門旅行的雙手是解放,帶來了很好的“工效”提升。
3. 人工智能的“智”:是指人工智能的關鍵算法,即“機器學習”。
機器學習是一門涉及統計學、系統辨識、逼近理論、神經網絡、優化理論、腦科學等諸多領域的交叉學科,研究計算機如何模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有知識結構并實現迭代,這是人工智能技術的核心。
基于數據的機器學習是從觀測數據(訓練集)出發尋找規律,利用這些規律對未來數據或無法觀測的數據進行預測,相關算法包括邏輯回歸、支持向量機方法、三層人工神經網絡方法、貝葉斯方法以及決策樹方法等,按照學習模式劃分,可分為以下3類
除了上述傳統的機器學習之外,深度學習,又被稱為深度神經網絡(指數層超過3層的神經網絡),是一個從2006年開始出現的新興領域,其實質是給出了一個將特征表示和學習合二為一的方式,其特點是放棄了可解釋性,只追求學習的有效性,目前兩類典型的模型是卷積神經網絡(CNN)和循環神經網絡(RNN)
值得一提的是,近期機器學習本身也正在走向機器學習的階段,這得益于谷歌在2017年推出的AutoML(Auto Machine Learning),即讓AutoML系統自主編寫機器學習代碼,一種能夠讓AI生成AI的人工智能。從人工智能應用的角度看,谷歌AutoML平臺將是一個非常方便的工具。如果單個企業定制人工智能方案,就要去定義算法,收集數據,通常要數個月或者數年才能完成。而谷歌AutoML平臺可以自動生成模型,產品周期被大大縮短,企業的花費也會降低。
4. 人工智能的“能”:是指實現人工智能的運算能力,GPU的出現讓并行計算成為可能,對數據處理規模、數據運算速度都帶來了指數級的增長。
作為計算能力的物質基礎,智能芯片被分別部署在云端和設備端,人工智能的訓練和推理通常在云端芯片實現,而設備端芯片用來處理實時性要求很高的設備,比如自動駕駛的車載攝像設備。智能芯片主要是通用類的芯片,包括CPU、GPU、NPU、FPGA。