1 Scrapy2 Beautiful Soup3 Python-Goose4 NLTK — Natural Language Toolkit5TextBlob: Simplified Text Processing6MBSP for Python7NumPy
python 語言文字相關的機器學習庫有哪些,在線求解答
1 Scrapy2 Beautiful Soup3 Python-Goose4 NLTK — Natural Language Toolkit5TextBlob: Simplified Text Processing6MBSP for Python7NumPy
(一)CaffeCaffe是一個清晰而高效的深度學習框架,也是一個被廣泛使用的開源深度學習框架,在Tensorflow出現(xiàn)之前一直是深度學習領域Github star最多的項目。Caffe的主要優(yōu)勢為:容易上手,網絡結構都是以配置文件形式定義,不需要用代碼設計網絡。訓練速度快,組件模塊化,可以方便拓展到新的模型和學習任務上。但是Caffe最開始設計時的目標只針對于圖像,沒有考慮文本、語音或者時間序列的數(shù)據(jù),因此Caffe對卷積神經網絡的支持非常好,但是對于時間序列RNN,LSTM等支持的不是特別充分。caffe工程的models文件夾中常用的網絡模型比較多,比如Lenet、AlexNet、ZFNet、VGGNet、GoogleNet、ResNet等。(二) Tensorflow1、概念介紹TensorFlow是一個使用數(shù)據(jù)流圖進行數(shù)值計算的開源軟件庫。圖中的節(jié)點表示數(shù)學運算,而圖邊表示在它們之間傳遞的多維數(shù)據(jù)陣列(又稱張量)。靈活的體系結構允許你使用單個API將計算部署到桌面、服務器或移動設備中的一個或多個CPU或GPU。(三) Keras1、概念介紹Keras由純Python編寫而成并基于Tensorflow、Theano以及CNTK后端,相當于Tensorflow、Theano、 CNTK的上層接口,號稱10行代碼搭建神經網絡,具有操作簡單、上手容易、文檔資料豐富、環(huán)境配置容易等優(yōu)點,簡化了神經網絡構建代碼編寫的難度。目前封裝有全連接網絡、卷積神經網絡、RNN和LSTM等算法。Keras有兩種類型的模型,序貫模型(Sequential)和函數(shù)式模型(Model),函數(shù)式模型應用更為廣泛,序貫模型是函數(shù)式模型的一種特殊情況。1)序貫模型(Sequential):單輸入單輸出,一條路通到底,層與層之間只有相鄰關系,沒有跨層連接。這種模型編譯速度快,操作也比較簡單2)函數(shù)式模型(Model):多輸入多輸出,層與層之間任意連接。這種模型編譯速度慢。