導(dǎo)讀:
針對中國700萬問題彩民的調(diào)查,管理學(xué)博士邵祥東提出了四點(diǎn)質(zhì)疑。最后總結(jié)到,問題彩民調(diào)查在抽樣方法、樣本框等方面存在諸多問題,就算對采集的數(shù)據(jù)做了嚴(yán)格處理,但因抽樣方法錯誤,則結(jié)論也是錯誤的,至少是不準(zhǔn)確的。700萬問題彩民的調(diào)查結(jié)論可能失真。
疑點(diǎn)一:樣本框是否被擴(kuò)大化?
若想調(diào)查中國問題彩民及行為,前提是界定樣本框,即參與問卷調(diào)查的人必須是彩民,之后才可繼續(xù)研究其中的問題彩民。抽樣框是指用以代表總體,并從中抽選樣本的一個框架,其具體表現(xiàn)形式主要有包括總體全部單位的名冊、地圖等。抽樣框在抽樣調(diào)查中處于基礎(chǔ)地位,是抽樣調(diào)查必不可少的部分,其對于推斷總體具有相當(dāng)大的影響。
此次問題彩民調(diào)查面向的主要人群是上網(wǎng)的人(不一定是網(wǎng)民),調(diào)查對象可能包括以下三類群體影響樣本框的準(zhǔn)確:一是非彩民人群,其填寫的問卷肯定是無效問卷;二是長期購買非法彩票的人,其成為問題彩民的根源并非因為購買國家彩票,而是因為長期大額購買非法彩票所致;三是網(wǎng)絡(luò)黑客等技術(shù)類人群,他們可以突破確保網(wǎng)絡(luò)調(diào)查安全而設(shè)置的防護(hù)網(wǎng),由此會引發(fā)網(wǎng)絡(luò)刷票行為。如果問題彩民調(diào)查未能控制這些人群,則樣本框必然擴(kuò)大,進(jìn)而導(dǎo)致調(diào)查結(jié)論失真。
疑點(diǎn)二:抽樣方法是否科學(xué)及是否誤用偶遇抽樣法?
最近一段時期,社會各界對北京師范大學(xué)彩票研究中心在今年3月份發(fā)布的《中國彩民行為網(wǎng)絡(luò)調(diào)查》(下稱“問題彩民調(diào)查”)中提到的中國現(xiàn)有問題彩民高達(dá)700多萬的研究結(jié)論高度關(guān)注,并就國家彩票的公益性和彩票機(jī)構(gòu)的社會責(zé)任展開討論。應(yīng)當(dāng)予以肯定的是,該課題研究具有歷史開創(chuàng)性和一定的現(xiàn)實意義。但是,調(diào)查方法的科學(xué)性和研究結(jié)論的準(zhǔn)確性存在多個疑點(diǎn),本文現(xiàn)從社會調(diào)查方法角度加以分析。
社會調(diào)查中的抽樣方法主要有純隨機(jī)抽樣、系統(tǒng)抽樣、類型抽樣、整群抽樣四種。
純隨機(jī)抽樣法的特點(diǎn)是:每個樣本單位被抽中的概率相等,樣本的每個單位完全獨(dú)立,彼此間無一定的關(guān)聯(lián)性和排斥性。該抽樣法適用于總體單位之間差異程度較小和數(shù)目較少時。
系統(tǒng)抽樣法的特點(diǎn)是:抽出的單位在總體中是均勻分布的,且抽取的樣本可少于純隨機(jī)抽樣。它是實際工作中應(yīng)用較多的方法,目前我國城鄉(xiāng)居民收支等調(diào)查,都采用這種方法。
類型抽樣的特點(diǎn)是:通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調(diào)查樣本。該方法適用于總體情況復(fù)雜,各單位之間差異較大,單位較多的情況。
整群抽樣的特點(diǎn)是:調(diào)查單位比較集中,調(diào)查工作的組織和進(jìn)行比較方便。但調(diào)查單位在總體中的分布不均勻,準(zhǔn)確性要差些。因此,在群間差異性不大或者不適宜單個抽選調(diào)查樣本的情況下,可采用這種方法。
中國彩民群體數(shù)量大,個體差異也大,不適合采用純隨機(jī)抽樣法和整群抽樣法。而要采用系統(tǒng)抽樣和類型抽樣需要分別解決好兩個問題,如采用系統(tǒng)抽樣法需要確定樣本標(biāo)志分為相關(guān)標(biāo)志和無關(guān)標(biāo)志,它們對等距抽樣的作用和相應(yīng)的估計進(jìn)度各有不同的影響。相關(guān)標(biāo)志即其與調(diào)查標(biāo)志具有共同性質(zhì)或密切關(guān)系。
很顯然,如果采用系統(tǒng)抽樣法,則以全國彩民在一定期限內(nèi)的購彩支出額為相關(guān)樣本標(biāo)志為好。但是,彩民群體數(shù)量大,且其購彩額無法得知。所以,即便采用系統(tǒng)抽樣法,若樣本標(biāo)志處理不好,也會出現(xiàn)結(jié)論錯誤。
根據(jù)社會調(diào)查理論和經(jīng)驗做法,關(guān)于中國問題彩民調(diào)查采用多段分層抽樣為宜。不過,多段分層抽樣不適合網(wǎng)絡(luò)調(diào)查(比如樣本無法科學(xué)分配)。綜上分析,四種社會調(diào)查方法都難以有效解釋700萬問題彩民這一調(diào)查結(jié)論的準(zhǔn)確性。
就實際調(diào)研情況推斷,問題彩民調(diào)查有誤用偶遇抽樣法的可能。偶遇抽樣基本理論依據(jù)是,被調(diào)查總體的每個單位都是相同的,因此把誰選為樣本進(jìn)行調(diào)查,其調(diào)查結(jié)果都是一樣的。而事實上并非所有調(diào)查總體中的每一個單位都是一樣的。只有在調(diào)查總體中各個單位大致相同的情況下,才適宜應(yīng)用偶遇抽樣法。它適用于探測性調(diào)查,或調(diào)查前的準(zhǔn)備工作。問題彩民調(diào)查采取的是網(wǎng)絡(luò)調(diào)查法,極可能陷入了偶遇抽樣法,如果推斷成立,則抽樣結(jié)果偏差增大,可信程度較低,樣本沒有足夠的代表性,調(diào)查結(jié)論也必然錯誤。
疑點(diǎn)三:網(wǎng)絡(luò)調(diào)查法的弊端是否被有效控制?
網(wǎng)絡(luò)調(diào)查法是一種新興的社會調(diào)查方法,它具有快捷、節(jié)省費(fèi)用等優(yōu)點(diǎn),但也存在一些弊端。
第一個弊端是技術(shù)手段無法控制調(diào)查對象身份和數(shù)據(jù)的真實性。目前,網(wǎng)絡(luò)調(diào)查法采用的主要技術(shù)手段有四種:一是檢驗網(wǎng)上用戶身份。即在調(diào)查中,為盡可能消除同一個被調(diào)查者多次填寫問卷,常采用“IP+若干特征標(biāo)志”技術(shù)手段作為判斷調(diào)查對象填寫次數(shù)唯一性的檢驗條件。在設(shè)計指標(biāo)體系時,所有可以肯定的邏輯關(guān)系和數(shù)量關(guān)系都應(yīng)充分利用,并被列入調(diào)查質(zhì)量檢驗程序,以實現(xiàn)網(wǎng)上用戶身份的唯一性,排除干擾;二是電子郵件+網(wǎng)絡(luò)密碼。采用電子郵件邀請和在線調(diào)查相結(jié)合方法,給調(diào)查對象提供一個含有密碼的鏈接,每一個調(diào)查對象的密碼彼此不同,且只能使用一次。當(dāng)調(diào)查對象點(diǎn)擊鏈接時,程序會讀取密碼并與數(shù)據(jù)庫核對,這樣可避免不合乎標(biāo)準(zhǔn)的人填寫問卷,防止調(diào)查對象多次填寫問卷;三是隨機(jī)IP自動撥叫技術(shù)措施。通過一個隨機(jī)IP地址發(fā)出軟件產(chǎn)生一批隨機(jī)IP,再由一個IP自動撥叫軟件向這些IP發(fā)出呼叫,傳送一個請調(diào)查對象參加調(diào)查的信息。收到該信息的網(wǎng)上用戶可以按照意愿決定是否參加調(diào)查;四是利用過濾器技術(shù)措施。根據(jù)具體調(diào)查問題選取有效的特征指標(biāo),如調(diào)查對象年齡、性別、學(xué)歷、職業(yè)、職務(wù)、地區(qū)以及其他品質(zhì)標(biāo)志和數(shù)量標(biāo)志等作為特征標(biāo)志,通過特征標(biāo)志將調(diào)查表中代表性差的樣本過濾出去。
但是,這四種技術(shù)措施仍然無法控制實際填寫問卷的人的主觀行為,如其是否是彩民或其填寫的信息是否準(zhǔn)確等,都無法驗證。就算調(diào)查者在調(diào)查之前制定了樣本分配方案,準(zhǔn)確限定了調(diào)查對象的身份,但是仍無法有效控制調(diào)查提供的信息的準(zhǔn)確性。而且,網(wǎng)絡(luò)刷票行為也無法得到有效控制。如果采用一對一的訪談式調(diào)查,這些問題就可以避免或減少。
第二個弊端是彩民群體和網(wǎng)民群體在地區(qū)空間分布方面存在差異。而且,網(wǎng)絡(luò)調(diào)查對象有限,選取的樣本難以具有代表性。
2012年1月16日,中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布了《第29次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,數(shù)據(jù)顯示:當(dāng)前互聯(lián)網(wǎng)在全民中的普及率不到四成,從地區(qū)空間分布結(jié)構(gòu)看,互聯(lián)網(wǎng)發(fā)展的地域差異明顯,北京市的互聯(lián)網(wǎng)普及率高達(dá)70.3%,而互聯(lián)網(wǎng)普及程度較低的云南、江西、貴州等省份互聯(lián)網(wǎng)普及率不到25%。普及程度超過全國平均水平的省市大部分集中在東部沿海。中部省市的互聯(lián)網(wǎng)普及率低于全國平均水平。西部省市普及率低于全球平均水平。網(wǎng)上調(diào)查參與者多是網(wǎng)民,網(wǎng)絡(luò)調(diào)查的總體即為是網(wǎng)民。但是目前中國的網(wǎng)民只占中國人口極少的一部分。我國網(wǎng)絡(luò)發(fā)達(dá)地區(qū)集中在東部地區(qū),僅以東部地區(qū)的彩民行為解釋全國彩民行為,難具全國代表性。
在城鄉(xiāng)結(jié)構(gòu)上,2011年,農(nóng)村網(wǎng)民占整體網(wǎng)民比例為26.5%。網(wǎng)民群體集中在城鎮(zhèn)地區(qū),農(nóng)村地區(qū)網(wǎng)絡(luò)普及率低。調(diào)查結(jié)果很顯然更多反映了城鎮(zhèn)地區(qū)彩民行為,對農(nóng)村地區(qū)彩民行為的代表性差。
由此可見,以全國不足四成、且存在嚴(yán)重地區(qū)結(jié)構(gòu)差異的網(wǎng)民做為問題彩民調(diào)查總體得出的全國性結(jié)論很難具有說服力。
此外,從年齡結(jié)構(gòu)上分析,2011年,我國10-29歲網(wǎng)民所占比重為56.5%,10-39歲網(wǎng)民所占比重為82.2%,20-29歲網(wǎng)民所占比重為55.5%。即部分70后、多數(shù)80后和90后人群是網(wǎng)民主體。問題彩民調(diào)查得出,73%的彩民年齡集中在26-34歲,這表明彩民具有年輕化特征。近些年來,深圳、廣州、武漢、合肥、南昌、沈陽等地福彩機(jī)構(gòu)都做過本地區(qū)彩民消費(fèi)調(diào)查,得出的結(jié)論是彩民年齡主要集中在35-55周歲,并不具有年輕化特征。而且,如果問題彩民調(diào)查得出的結(jié)論為真,則多數(shù)彩民的年齡段和網(wǎng)民主體的年齡段高度一致,這令人產(chǎn)生如下疑問:參與網(wǎng)絡(luò)調(diào)查的彩民群體基本上都是網(wǎng)民,非網(wǎng)民的彩民群體被排除在調(diào)查范疇之外。從職業(yè)結(jié)構(gòu)方面看,學(xué)生是網(wǎng)民中規(guī)模最大的群體,占比為30.2%,如果結(jié)合這一指標(biāo),那么可以推斷出參與問題彩民調(diào)查的人群中可能包括了收入水低的在校學(xué)生,而這部分群體并不是我國彩民主體?!兜?9次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》數(shù)據(jù)還顯示,截至2011年12月底,中國網(wǎng)民規(guī)模達(dá)到5.13億,其中,中國手機(jī)網(wǎng)民規(guī)模達(dá)到3.56億。這部分群體也多是年輕的在校學(xué)生。
網(wǎng)絡(luò)調(diào)查法的作用是很有限的。如果調(diào)查“中國城鎮(zhèn)地區(qū)居民上網(wǎng)購物狀況”,則網(wǎng)絡(luò)調(diào)查無疑是一種較好的社會調(diào)查方法。但,若是調(diào)查中國民眾對目前南海局勢的看法,則網(wǎng)絡(luò)調(diào)查的代表性就無法保障了,因為很多關(guān)注南海局勢的民眾并不上網(wǎng),尤其是年紀(jì)稍大的民眾。
疑點(diǎn)四:樣本數(shù)越大,調(diào)查結(jié)論越準(zhǔn)確?
問題彩民調(diào)查顯示,參與調(diào)查的人數(shù)高達(dá)176200多人,有效問卷也多達(dá)38000多份。這給公眾傳遞了一個信號:樣本數(shù)越大,調(diào)查結(jié)論越準(zhǔn)確。事實果真如此?以具有代表性的是美國著名刊物《文學(xué)文摘》預(yù)測1936年美國總統(tǒng)選舉結(jié)果出現(xiàn)重大失誤的實例。當(dāng)年的兩位候選人是民主黨的羅斯福和共和黨的蘭登,大多數(shù)民意測驗,新聞機(jī)構(gòu)和政治觀察家都預(yù)測羅斯福會獲勝,但《文學(xué)文摘》與眾不同,它預(yù)言蘭登會以57%:43%的優(yōu)勢戰(zhàn)勝羅斯福。最后結(jié)果是:羅斯福以62%:38%的壓倒優(yōu)勢當(dāng)選。由于這個重大失誤,這家雜志不久即宣告破產(chǎn)。該刊起初擬訪問對象為1000萬人,研究人員認(rèn)為在這個龐大的樣本中,美國社會各階層的代表性會好些。但這1000萬人中只有240萬人寄回了對問題單的回答。較富有的人,對當(dāng)時現(xiàn)實抱比較滿意態(tài)度以及文化水平較高的人,做出回答的可能性要大些,這個傾向有利于共和黨。這是一個系統(tǒng)性偏差,它加重了原來在挑選樣本時已存在的系統(tǒng)性偏差。這一點(diǎn)曾在芝加哥地區(qū)得到證實:該刊向芝加哥地區(qū)1/3的登記選民發(fā)了問題單,有20%的人做了回答,其中半數(shù)以上有利于蘭登。但實際結(jié)果是:羅斯福和蘭登在芝加哥的支持率確實2:1。
類似于本例的錯誤,在其他抽樣調(diào)查工作中也時有發(fā)生。除了有意的偏向外,為圖工作省事而不去認(rèn)真研究隨機(jī)化抽樣方案,是一個常見的原因。
網(wǎng)絡(luò)抽樣調(diào)查是根據(jù)部分實際調(diào)查結(jié)果來推斷總體標(biāo)志總量的一種統(tǒng)計新興調(diào)查方法。它需按照科學(xué)的原理和計算,從若干單位組成的事物總體中,抽取部分樣本單位來進(jìn)行調(diào)查、觀察,用所得到的調(diào)查標(biāo)志的數(shù)據(jù)以代表總體,推斷總體。問題彩民調(diào)查在抽樣方法、樣本框等方面存在諸多問題,就算對采集的數(shù)據(jù)做了嚴(yán)格處理,但因抽樣方法錯誤,則結(jié)論也是錯誤的,至少是不準(zhǔn)確的。700萬問題彩民的調(diào)查結(jié)論可能失真。
(邵祥東)
邵祥東,管理學(xué)博士,在媒體發(fā)表彩票文章39篇。專著《中國社會福利事業(yè)發(fā)展與挑戰(zhàn):以福利彩票為范例的研究》。參編著作《民政法制概述》(2011年8月1日出版),負(fù)責(zé)“福利彩票法制概述”一章。
參與國家社科基金課題和國家自然科學(xué)基金課題2項,國家發(fā)改委、遼寧省科技廳、省財政廳、省哲學(xué)社科基金、省發(fā)改委等重大課題9項。發(fā)表論文17篇,參編著作5部,獲省級科研成果二等獎、三等獎5項。
?
相關(guān)新聞:
我國問題彩民成亟待解決問題:打工者癡迷度高?
·凡注明來源為“??诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實性負(fù)責(zé)。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報郵箱:jb66822333@126.com