定性和定量大數據分析方法?我們看到數據時想到的第一件事是什么?第一個本能是找到模式,聯(lián)系和關系。我們查看數據以發(fā)現其中的含義。
同樣,在研究中,一旦收集了數據,下一步就是從中獲取見解。例如,如果服裝品牌試圖確定年輕女性的最新趨勢,那么該品牌將首先與年輕女性接觸,并向她們詢問與研究目標相關的問題。在收集了這些信息之后,該品牌將分析該數據以識別樣式-例如,它可能會發(fā)現大多數年輕女性希望看到更多的牛仔褲。
大數據分析是研究人員從大量數據到有意義的見解的方式。取決于研究類型,有許多不同的大數據分析方法。您可以使用以下幾種方法來分析定量和定性數據。
分析不良數據非常困難。通過我們的博客“ 4種數據收集技術:哪個適合您?”,確保您正在收集高質量的數據 。
分析定量數據
資料準備
分析數據的第一步是數據準備,其目的是將原始數據轉換為有意義且可讀的內容。它包括四個步驟:
步驟1:資料驗證
數據驗證的目的是盡可能地找出數據收集是否按照預設的標準進行并且沒有任何偏差。這是一個四步過程,其中包括…
欺詐,以推斷每個受訪者是否真正接受了采訪。
篩選,以確保根據研究標準選擇了受訪者。
Procedure,以檢查是否已正確執(zhí)行數據收集過程。
完整性,以確保訪調員向受訪者提出所有問題,而不僅僅是幾個必填問題。
為此,研究人員需要從已完成的調查中隨機抽取一個樣本并驗證收集到的數據。(請注意,這對于包含大量回復的調查可能會非常耗時。)例如,假設有一個200名受訪者被分為兩個城市的調查。研究人員可以從每個城市中隨機抽取20名受訪者作為樣本。此后,研究人員可以通過電子郵件或電話與他們聯(lián)系,并檢查他們對某些問題的回答。
首先檢查18個數據驗證,這些數據驗證可防止不良數據進入您的數據集。
步驟2:資料編輯
通常,大數據集包含錯誤。例如,受訪者可能會錯誤填寫字段或意外跳過字段。為了確保沒有此類錯誤,研究人員應進行基本數據檢查,檢查異常值,并編輯原始研究數據,以識別和清除所有可能影響結果準確性的數據點。
例如,錯誤可能是被調查者留空的字段。編輯數據時,確保刪除或填充所有空白字段非常重要。(這里有4種方法來處理丟失的數據。)
步驟3:資料編碼
這是數據準備中最重要的步驟之一。它是指對調查的答復進行分組和分配值。
例如,如果研究人員訪問了1000人,現在想查找受訪者的平均年齡,則研究人員將創(chuàng)建年齡段,并根據這些代碼對每個受訪者的年齡進行分類。(例如,年齡在13-15歲之間的受訪者將其年齡編碼為0,將16-18編碼為1,將18-20編碼為2,等等)
然后,在分析過程中,研究人員可以處理簡化的年齡段,而不是處理大量的個人年齡段。
定量大數據分析方法
完成這些步驟后,就可以進行大數據分析了。兩種最常用的定量大數據分析方法是描述性統(tǒng)計和推斷性統(tǒng)計。
描述性統(tǒng)計
通常,描述性統(tǒng)計(也稱為描述性分析)是分析的第一級。它可以幫助研究人員匯總數據并找到模式。一些常用的描述性統(tǒng)計數據是:
平均值:一組值的數值平均值。
中位數:一組數值的中點。
模式:一組值中最常見的值。
百分比:用于表示數據中的一個值或一組答復者與較大的一組答復者之間的關系。
頻率:找到值的次數。
范圍:一組值中的最高和最低值。
描述性統(tǒng)計信息提供絕對數字。但是,他們沒有解釋這些數字背后的理由或理由。在應用描述性統(tǒng)計之前,重要的是要考慮哪一個最適合您的研究問題以及您想展示什么。例如,百分比是顯示受訪者性別分布的好方法。
當研究僅限于樣本并且不需要推廣到更大的人群時,描述性統(tǒng)計最有用。例如,如果您比較兩個不同村莊中接種疫苗的兒童的百分比,則描述性統(tǒng)計就足夠了。
由于描述性分析主要用于分析單個變量,因此通常稱為單變量分析。
分析定性數據
定性大數據分析的工作原理與定量數據有所不同,主要是因為定性數據是由單詞,觀察值,圖像甚至符號組成的。從這樣的數據中得出絕對含義幾乎是不可能的。因此,它主要用于探索性研究。雖然在定量研究中,數據準備階段和大數據分析階段之間存在明顯的區(qū)別,但定性研究的分析通常在數據可用后立即開始。
數據準備和基本大數據分析
分析和準備工作并行進行,包括以下步驟:
熟悉數據:由于大多數定性數據只是文字,因此研究人員應先讀取數據幾次以熟悉數據,然后開始尋找基本的觀察結果或模式。這也包括轉錄數據。
重新研究目標:在這里,研究人員重新審查研究目標,并確定可以通過收集的數據回答的問題。
開發(fā)框架:也稱為編碼或索引,在這里研究人員識別出廣泛的想法,概念,行為或短語,并為其分配代碼。例如,編碼年齡,性別,社會經濟地位,甚至概念,例如對問題的肯定或否定回答。編碼有助于結構化和標記數據。
識別模式和聯(lián)系:對數據進行編碼后,研究就可以開始確定主題,尋找最常見的問題答案,識別可以回答研究問題的數據或模式,并找到可以進一步探索的領域。
定性大數據分析方法
有幾種方法可用于分析定性數據。最常用的大數據分析方法是:
內容分析:這是分析定性數據的最常用方法之一。它用于分析文本,媒體甚至物理項目形式的文檔信息。何時使用此方法取決于研究問題。內容分析通常用于分析受訪者的回答。
敘事分析:此方法用于分析各種來源的內容,例如受訪者的訪談,實地觀察或調查。它著重于利用人們分享的故事和經驗來回答研究問題。
話語分析:話語分析與敘事分析一樣,用于分析與人的互動。但是,它著重于分析研究者與受訪者之間進行交流的社會環(huán)境。話語分析還會查看受訪者的日常環(huán)境,并在分析過程中使用該信息。
扎根理論:這是指使用定性數據來解釋為什么發(fā)生某種現象。它通過在不同的環(huán)境中研究各種相似的案例并使用數據得出因果關系來做到這一點。研究人員在研究更多案例時可能會更改解釋或創(chuàng)建新的解釋,直到得出適合所有案例的解釋。
這些方法是最常用的方法。但是,也可以使用其他大數據分析方法,例如會話分析。
大數據分析也許是研究中最重要的組成部分。較弱的分析會產生不準確的結果,不僅會影響研究的真實性,還會使發(fā)現無法使用。必須謹慎選擇大數據分析方法,以確保您的發(fā)現具有洞察力和可操作性。
填寫下面表單即可預約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學費! 怕學不會?助教全程陪讀,隨時解惑!擔心就業(yè)?一地學習,可推薦就業(yè)!
?2007-2022/ m.5wd995.cn 北京漫動者數字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc