亚洲男人在线天堂,一级毛片无码视频在线,老妇人妻在线视频,国产精品亚洲第五区在线,狠狠色成色综合网,久久青草91线频免费观看,美女涩视频网站

<b id="70ogg"><dfn id="70ogg"><form id="70ogg"></form></dfn></b>

<u id="70ogg"><progress id="70ogg"><kbd id="70ogg"></kbd></progress></u>

<b id="70ogg"><dfn id="70ogg"></dfn></b>

河源新聞網(wǎng)由河源晚報(bào)社主辦!新聞網(wǎng)旗下：在線數(shù)字報(bào) | 新少年

當(dāng)前位置：河源新聞網(wǎng) >> 資訊 > 財(cái)經(jīng) > 閱讀新聞

R語言批量文本處理并生成詞云聚信立

2018-01-02 14:57:26 來源：河源晚報(bào) 點(diǎn)擊：【大】【中】【小】

針對某一個事件或者人物或者實(shí)體，會有很多相關(guān)文本對其描述，他們可能來自不同的媒介，例如：關(guān)于金融的報(bào)道會有很多不同媒體寫了不同的文章，當(dāng)我們分析這些數(shù)據(jù)的時候，它們經(jīng)常是多個文件。如下圖1所示一個文本文件對應(yīng)一篇報(bào)道文章。

圖1 每個文本代表一篇針對金融的報(bào)道文章

本文使用R語言批量處理這樣的文本數(shù)據(jù)，對他們進(jìn)行分詞及詞頻統(tǒng)計(jì)，最后我們根據(jù)聚信立logo生成了詞云聚信立，這種方式在ppt演講、會場布置及公司宣傳等場景下有很好的應(yīng)用性。

下面我們先上效果圖，再貼上R語言的相關(guān)程序代碼。圖2 是聚信立的文字logo，圖3相關(guān)報(bào)道的詞云聚信立logo。

圖2 聚信立文字logo

圖3 由詞云生成的聚信立logo(應(yīng)用在ppt報(bào)告、公司宣傳、會場布置等很多場景)

最后是R源代碼：

library(rJava)

library(Rwordseg)

library(RColorBrewer)

library(wordcloud)

library(wordcloud2)

#路徑

dir <- "D:/C000007"

#路徑下文件名

names <- list.files(dir)

dirname <- paste(dir,names,sep="/")

#文件數(shù)量

n <- length(dirname)

#finaldata = read.csv(file = dirname[1],stringsAsFactors=F,header=F,encoding = 'UTF-8')

finaldata = read.csv(file = dirname[1],stringsAsFactors=F,header=F)

finaldata

#循環(huán)組裝到一個data.frame中

for (i in 2:n)

{

#new.data = read.csv(file = dirname[i],stringsAsFactors=F,header=F,encoding = 'UTF-8')

new.data = read.csv(file = dirname[i],stringsAsFactors=F,header=F)

flen=length(new.data)

if(flen==1) finaldata = rbind(finaldata,new.data)

if(flen>1)

{

newstr=''

for(j in 1:flen)

{

newstr=paste(newstr,new.data[,j])

}

newdataframe=data.frame(V1=newstr)

finaldata = rbind(finaldata,newdataframe)

}

}

#可使用write.table 將finaldata寫出

#分詞并統(tǒng)計(jì)詞頻

words=unlist(lapply(X=finaldata$V1, FUN=segmentCN))

word=lapply(X=words, FUN=strsplit, " ")

v=table(unlist(word))

#降序排列

v=rev(sort(v))

#組裝成詞云數(shù)據(jù)框

d=data.frame(v,row.names = names(v))

#繪制詞云

mydata=d

wordcloud2(mydata,size = 1.2,figPath='D:/juxinli.jpg')

相關(guān)熱詞搜索：文本語言云聚信

上一篇：廣發(fā)行傾力澆灌實(shí)體經(jīng)濟(jì) 跨境托管業(yè)務(wù)位居股份制銀行第一位
下一篇：中行與國家開發(fā)銀行簽署全面合作協(xié)議提升服務(wù)實(shí)體經(jīng)濟(jì)能力

熱點(diǎn)圖片

: 全民健身與奧運(yùn)同行

: 弘揚(yáng)紅色文化凝聚奮進(jìn)力量 “南粵明燈——省委舊址·行”巡展活動走進(jìn)河源

: 萬綠湖水上聯(lián)合執(zhí)法“百日攻堅(jiān)”行動啟動

: 暑期系列招聘會首場啟動

頭條新聞
新聞推薦

最新專題

: 酷暑時節(jié)，下水游泳戲水的人增多，也到了溺水傷亡事件易發(fā)高發(fā)季節(jié)。近日，記者走訪發(fā)現(xiàn)，雖然市區(qū)河湖周邊基本立有警示牌，但不少公開的危險(xiǎn)水域仍有野泳者的身影。為嚴(yán)防溺水事故發(fā)生，切...

熱度排行

關(guān)于我們 | 廣告服務(wù) | 友情鏈接 | 案例展示 | 聯(lián)系我們 | 版權(quán)聲明

<b id="f80i0"><dfn id="f80i0"><delect id="f80i0"></delect></dfn></b>

<samp id="f80i0"><del id="f80i0"></del></samp>

<table id="f80i0"><nav id="f80i0"></nav></table>