
上QQ阅读APP看书,第一时间看更新
第1章 导论
自然语言处理是文本挖掘的研究领域之一,是人工智能和语言学领域的分支学科,是研究人与计算机交互的学科,是处理及运用自然语言的新兴技术。随着现代化技术的不断发展,当前自然语言处理已经逐渐迈向了人机交互的问题探索:如何保证人与计算机更高效地通信。
自然语言处理主要分为4个阶段:缜密的数学形式化模型表征人类的自然语言;数学化模型转换成能在计算机上表示的算法模型;根据所定义的计算机算法模型,编写计算机语言程序,使模型得以应用化实现;对所得到的自然语言处理模型优化改进,应用于更多领域,然而,人机交互的情况非常复杂。究其原因,除了计算机性能因素外,更重要的原因在于自然语言的复杂性。人类自然语言除了字、词、句、篇等结构划分外,还涉及音、形、义。同一语句,可能因为语调不同而意义完全不同。美国学者Daniel将复杂的语言行为总结为6方面的知识:语音学与音系学、形态学、句法学、语义学、语用学和话语学。这6方面的复杂性为计算机处理自然语言带来了极大的障碍。