中新社西寧3月20日電 “‘云藏’作為全球首個藏文智能搜索引擎,目前開發(fā)已處于藏文信息錄入和分詞標(biāo)注階段,預(yù)計將于2014年8月左右正式上線試運營?!鼻嗪J『D喜刈遄灾沃莶卣Z委辦主任、“云藏”引擎開發(fā)負(fù)責(zé)人才洛20日告訴中新社記者。
“云藏”一詞是藏文的音譯詞,有兩層含義,其一為“上師”或“老師”,意為有求必應(yīng)、有問必答;其二是將其分為單字,有“全面抓取、提取”之意。
才洛介紹,“云藏”藏文智能搜索引擎以青海湖藏漢文網(wǎng)站為平臺進(jìn)行開發(fā),是青海省少數(shù)民族事業(yè)“十二五”規(guī)劃中藏文信息化建設(shè)的重要組成部分,目前累計投資達(dá)1300萬元人民幣。
自2012年4月“云藏”搜索引擎啟動實施至今將近兩年的時間里,開發(fā)團(tuán)隊曾多次赴北京大學(xué)、中央民族大學(xué)、西北民族大學(xué)等院校,與藏文信息處理方面具有豐富經(jīng)驗的權(quán)威專家學(xué)者進(jìn)行研討,廣泛整合藏文核心技術(shù)處理方面的信息資源,為項目的實施提供了堅實的基礎(chǔ)。
“云藏”搜索引擎研發(fā)團(tuán)隊現(xiàn)有工作人員100人,由藏文信息錄入組、分詞標(biāo)注組和技術(shù)組三個小組構(gòu)成,團(tuán)隊中藏族比例達(dá)84%,相關(guān)技術(shù)支持由中科院靈玖中科軟件(北京)有限公司和北京線點科技有限公司提供。
據(jù)海南州藏文信息技術(shù)研究中心負(fù)責(zé)人多杰拉旦透露,“云藏”搜索引擎現(xiàn)已完成主要架構(gòu),處于藏文信息錄入和分詞標(biāo)注階段,其中信息錄入涵蓋藏族天文、歷法、醫(yī)學(xué)、經(jīng)文以及寺院簡介等諸多領(lǐng)域,工作量巨大且繁瑣。
“相比傳統(tǒng)的谷歌藏文搜索模式,‘云藏’引擎建成后不僅能夠解決藏文搜索中不能識別語義、詞匯打亂導(dǎo)致搜索結(jié)果不穩(wěn)定等問題,而且95%以上的藏文輸入正確識別率,更能滿足藏文網(wǎng)民個性化的檢索需求,使藏文全方位融入互聯(lián)網(wǎng)世界”多杰拉旦說。
才洛認(rèn)為:“搜索引擎作為文化與歷史傳承的新載體,它對一國的文化安全有著相當(dāng)重要的意義,任何搜索引擎都是有立場、有傾向的,在互聯(lián)網(wǎng)時代,抓住搜索引擎,就等于抓住了互聯(lián)網(wǎng)上信息傳遞的主動權(quán)。顯然,藏文搜索引擎的建設(shè)不但有助于藏語文的保護(hù)、傳播、使用,也將極大地促進(jìn)藏族現(xiàn)代文化的發(fā)展,更加有利于藏區(qū)社會的現(xiàn)代轉(zhuǎn)型。”
另據(jù)才洛透露,“云藏”搜索引擎跨蘋果iOS和Android系統(tǒng)的藏文轉(zhuǎn)碼校譯工作已進(jìn)入準(zhǔn)備階段。(完)
?
相關(guān)鏈接:
海南互聯(lián)網(wǎng)用戶達(dá)750萬戶 搜索引擎等是應(yīng)用首選?
·凡注明來源為“??诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報郵箱:jb66822333@126.com