`
hujunkun
  • 浏览: 6462 次
  • 性别: Icon_minigender_1
  • 来自: 合肥
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果中出现的顺序。   TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高, ...
M——专著; C——-论文集;   N——报纸文章; J——期刊文章; D——学术论文; R——报告; S——标准; P——专利; A——专著、论文集中的析出文献; Z——其它末说明文献。
K近邻(weka内所谓的IBk ) 决策树(weka内所谓的J48 ) Naive Bayes(weka内所谓的Naive Bayes) SVM(在weka的所谓SMO)
Maven2是一个优秀的项目建构工具。 Maven2改写了Maven 1.0版本,在使用时更加方便和灵活。基本上现在都是使用Maven2来进行项目的建构。要想使用Maven2,请按照以下步骤来完成Maven的配置。 首先下载Maven2。下载地址:http://maven.apache.or ...
Global site tag (gtag.js) - Google Analytics