常用的文本挖掘方法(常用的文本挖掘方法有哪些)-百科知识-康晓发稿屋

日前，常用的文本挖掘方法的话题受人关注，并且与之相关的常用的文本挖掘方法有哪些同样热度很高。今天，康晓百科便跟大家说一说这方面的相关话题。

常用的文本挖掘方法(常用的文本挖掘方法有哪些)

导读目录：

考古发掘最简单的方法？

数据挖掘分类方法有哪些？

考古探方发掘方法？

考古发掘最简单的方法？

1.收集资料

2.考古调查。调查是发掘的准备。只有经过调查，才能选定发掘的地点和对象，并决定采用什么方法进行发掘。

3.清楚地层，这就要求考古工作者必须具有细致、谨慎的工作态度，采用严密、妥善的发掘方法。

4.具体挖掘，在全部发掘过程中，都要做好记录工作。记录的方式主要分文字、绘图和照像3种，必要时还要 *** 模型。

数据挖掘分类方法有哪些？

数据挖掘分类方法有下列几种：

（1）决策树

决策树归纳是经典的分类算法。它采用自顶向下递归的各个击破方式构造决策树。树的每一个结点上使用信息增益度量选择测试属性。可以从生成的决策树中提取规则。

(2) KNN法(K-Nearest Neighbor)

KNN法即K最近邻法，最初由Cover和Hart于1968年提出的，是一个理论上比较成熟的方法。该方法的思路非常简单直观：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

(3) SVM法

SVM法即支持向量机(Support Vector Machine)法，由Vapnik等人于1995年提出，具有相对优良的性能指标。该方法是建立在统计学习理论基础上的机器学习方法。通过学习算法，SVM可以自动寻找出那些对分类有较好区分能力的支持向量，由此构造出的分类器可以更大化类与类的间隔，因而有较好的适应能力和较高的分准率。该方法只需要由各类域的边界样本的类别来决定最后的分类结果。

(4) V *** 法

V *** 法即向量空间模型(Vector Space Model)法，由Salton等人于60年代末提出。这是最早也是最出名的信息检索方面的数学模型。其基本思想是将文档表示为加权的特征向量：D=D(T1，W1；T2，W2；…；Tn，Wn)，然后通过计算文本相似度的方法来确定待分样本的类别。当文本被表示为空间向量模型的时候，文本的相似度就可以借助特征向量之间的内积来表示。

在