一、自然語言處理是什么?
自然語言處理說白了,就是讓機器去幫助我們完成一些語言層面的事情,典型的比如:情感分析、文本摘要、自動問答等等。我們日常場景中比較常見到的類似Siri、微軟小冰之類的,這些的基礎都是自然語言處理,另外還有一些語音處理,這就暫且不表了??傊?,你看到的機器與人利用語言交互,用機器模擬人腦閱讀,對話,評論等等這些的基礎都是自然語言處理的范疇之內。
二、自然語言處理怎么學?
自然語言處理的實際入門步驟來說,假如單單從應用來說,我覺得還是直接先從簡單的應用搞起更好一點,上來就是理論的話可能對一些人還是比較枯燥,我認為一個好的過程是:實踐-理論-實踐,先由實踐搞起,加深興趣,然后理論研究,深化理解,后繼續(xù)實踐,知行合一。閑言少敘,下面說下自己的入門步驟:
1、分詞
2、關鍵詞提取
3、詞向量
4、文本分類
5、自動問答
三、自然語言處理的深入
談到自然語言處理的深入,這個可以做的就比較多了,上面列舉的各個方面都與比較大的優(yōu)化空間。但總體而言,的幾個問題在于分詞、詞向量的轉化以及文本特征的提取,這也是一定程序上困擾我們繼續(xù)提高的幾大阻礙。拿分詞來說,無論是基于詞典和算法的分詞還是目前基于深度學習的分詞方式,都只能說一定程度上進行分詞實現(xiàn),想要達到人腦的分詞效果,實際上還是前路漫漫;詞向量的轉化在一定程序上也依賴于大量的語料,而我們也不可能在訓練模型時囊括所有的詞語,所有的語境,所有的文本,這些也都是不現(xiàn)實的,只能說時優(yōu)化算法或者選擇一種更好的方式;文本特征的提取也是一個我們在后期進行學習過程中一個繞不過去的坎。總而言之,自然語言處理說簡單也簡單,說難也難,就看你想要達到什么樣的高度。