人工智能是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學,該領域的研究包含計算智能、機器感知、機器學習等,如圖7 所示。機器學習作為人工智能的一類,它是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。機器學習在工業中的典型應用場景為:工況模式識別、設備故障診斷、產品質量分類等。本文將從機器學習中的K 近鄰算法來對鍛造領域進行研究與探討。K 近鄰算法
K 近鄰法(k-nearest neighbors)是機器學習中較基礎的一類算法,它是由Cover 和Hart 于1968 年提出的,是懶惰學習(lazy learning)的著名代表。K 近鄰算法中每個數據都存在一個標簽(label),即數據的最終特征,此外還包含了影響數據特征的各影響因素,K 近鄰算法的工作機制如下:首先給定一個測試樣本,計算它到訓練樣本的距離,然后取離測試樣本最近的k 個訓練樣本,最終用“投票法”選出在這k個樣本中出現最多的類別,就是預測的結果。樣本可以根據比例分為訓練集與測試集,訓練集負責用于模型的訓練,測試集負責模型的實際測試,測試集中測試成功數量與測試集總數量之比為準確率,準確率也是衡量K 近鄰算法好壞的唯一標準。圖8 是筆者運用傳統K 近鄰算法訓練傳統Mnist 數據集的程序。Mnist數據集是K 近鄰算法的基礎數據集,共有70000 條數據,每個數據集都是由人為手寫的數字構成,每條數據共含有784 條特征。其中,此程序用了20000 個數據集作為測試,50000 個數據集作為訓練,模型的準確率達到了97.6%,如圖9 所示,機器通過圖片將手寫的‘8’識別了出來。