鄭州大數(shù)據(jù)培訓 什么是數(shù)據(jù)感知技術?
來源:
奇酷教育 發(fā)表于:
鄭州大數(shù)據(jù)培訓 什么是數(shù)據(jù)感知技術?相信很多人都不知道,其實數(shù)據(jù)感知也屬于數(shù)據(jù)質(zhì)量管理的技術,今天奇酷教育就為大家講講什么是
鄭州大數(shù)據(jù)培訓 什么是數(shù)據(jù)感知技術?相信很多人都不知道,其實數(shù)據(jù)感知也屬于
數(shù)據(jù)質(zhì)量管理的技術,今天
奇酷教育就為大家講講什么是數(shù)據(jù)感知技術?數(shù)據(jù)感知技術應用有呢些?
什么是數(shù)據(jù)感知技術
對于感知的定義是客觀事件通過感覺器官在人腦中的直接反映。而所謂數(shù)據(jù)感知,就是通過對數(shù)據(jù)的一些特征信息來對數(shù)據(jù)進行描述。比如,我們看到遠處有1個人,長頭發(fā)穿著紅色衣服高跟鞋,那么我們就可以推測那個人是女的。當然,這個過程也可能會出現(xiàn)不準確的問題,比如那個人是個男的,就這樣打扮。
而數(shù)據(jù)感知技術可以實現(xiàn)給我們1組樣本數(shù)據(jù),我們可以知道它是哪種類型。比如,給我們?nèi)缦掠涗?組數(shù)據(jù):
62463359632,96332156325,426499225332...71269742
通過我們的感知技術我們可以識別它為手機號碼和電話號碼,其中手機占據(jù)的比例假設為60.82%,而電話號碼占據(jù)的比例為32.22%,而剩下還有6.96%的數(shù)據(jù)無法被識別出來,因此我們可以推斷當前數(shù)據(jù)為聯(lián)系方式為主。
需要注意的是,在記錄中需要滿足隨機性,不然感知出來的結果可能會差強人意。
當然,這是比較簡單的1個例子。當然我們還可以識別中文姓名、地址信息、企業(yè)名稱、工商注冊范圍、工商注冊資金等類型,這里就涉及到概率論及統(tǒng)計學的一些內(nèi)容了。當然,還會涉及到一些線性代數(shù)的內(nèi)容,比如貝葉斯網(wǎng)絡轉(zhuǎn)移矩陣的使用,會用到矩陣的相關知識。