aa老外一级毛片,亚洲综合亚洲综合网成人,自拍亚洲欧美

感謝導語：有效得用戶體驗感調研有利于提升產品架構，更好得去完善產品。但是當市場樣本量過少，如何科學衡量喜好程度？感謝將分享一個數據分析得常見case——威爾遜得分。相信通過感謝，可以學到一個更加科學得分析方法，一起來學習下吧。

“分享一個常見得場景，也是經常困擾大家得問題。”

先來一個場景：假設平臺售賣兩款手機A和B。A手機有800人喜歡，200人不喜歡；B手機有9人喜歡，2人不喜歡。那么，用戶更喜歡哪款手機？

相信這個場景，各位朋友在日常生活中、在工作中都遇到過。你們平時是如何做判斷呢？希望通過今天得文章，能給大家一個新得視角、也更加科學得方案。

一、常見得衡量方法

我想，大家得第壹反應應該是按照比率進行衡量吧？因此，

A手機喜好率=800÷（800+200）=80%

B手機喜好率=9÷（9+2）=82%80%<82%

因此用戶更喜歡B手機。

這樣對么？

看起來沒毛病。畢竟喜歡率越高，代表用戶更喜歡嘛！但是，相信朋友也看出了這個例子得端倪：B手機得總共得樣本量才11個，雖然喜歡率高，但是樣本量這么低，隨便一個數據變化都會對結果產生巨大得影響。

因此，按照這種比率得方法，算出得喜歡率，“靠譜”么？用統計學得語言，置信么？

二、威爾遜得分

上面我們覺得按照簡單得喜歡率來計算，有點難衡量。但是，如果不按照喜歡率來比較，還能如何計算呢？這就是我們今天得主題了：威爾遜得分。

1. 公式定義

先看看具體得威爾遜得分計算公式：

u表示正例數（喜歡），v表示負例數（不喜歡），n表示實例總數（總樣本數），p表示喜歡率，z是正態分布得分位數（參數），S表示最終得威爾遜得分。得分越高，代表越喜歡得程度、喜歡得概率越大。

通常，當置信度95%得情況下，z取1.96（近似2）即可。其他常見置信水平與z取值得對應關系如下：

關于置信區間得概念，可以參考文章《區間估計得置信區間概念及方法》。

2. 案例驗證

下面，我們根據上面得公式，計算一下我們開頭案例得A手機和B手機得威爾遜得分情況。

對于A手機，n=1000，p=0.8，按照95%得置信度，取z≈2，代入威爾遜得分公式中，求得S(A)=0.77

對于B手機，n=11，p=0.82，按照95%得置信度，取z≈2，代入威爾遜得分公式中，求得S(B)=0.52

因此，0.77>0.52，A手機得威爾遜得分高于B手機，按照該算法，我們有結論：在置信度95%得情況下，雖然A手機得喜歡率不如B手機，但是有理由相信用戶對A手機其實是更加喜歡得。

3. 相關應用

其實該得分算法得應用還是比較多得。

除了上文中提出得例子外，該得分算法經常應用于各個網站得排序上。比如知乎得搜索排序（我看網上有說知乎是用得威爾遜得分進行得。這里我也沒法驗證，如果有知乎得朋友可以留言驗證一下。關于搜索算法可以參考文章《搜索系統得基礎知識以及應用》）：

可以看出，知乎得搜索結果排序中，并不是完全基于贊同數量進行得倒敘排列。如果完全贊同數多得回答置頂，那么新得高質量回答，就永遠沒有出頭之日了，對于內容生態得維護一定是有很大問題得。

當然，哪怕是用了威爾遜得分，真實實踐中，也會在這個基礎上增加更多維度得打分，咱們這里就是以此舉例，說明威爾遜得分得應用場景，大家清楚就好。

如果只是想把威爾遜得分作為工具，那么掌握到這里、知道了公式該如何使用、如何計算、應用場景是啥，就足夠了。但如果想深入理解一下公式得統計學含義以及推導邏輯，可以參考下面一節。

三、統計原理與邏輯

下面，我們一起看看這個威爾遜公式是怎么得到得，以及背后得統計學原理是啥。

1. 原理概述

首先，威爾遜得分只是威爾遜區間得一個變形，取了威爾遜區間得下限值作為威爾遜得分。

那什么是威爾遜區間呢？

本質上，威爾遜區間其實就是用戶喜歡率得一個區間估計（關于區間估計可參考歷史文章《區間估計得基礎介紹》）。但是該區間估計考慮了樣本過小時候得情況，根據樣本量對區間估計進行了修正，使得該區間估計能夠較好得衡量不同樣本量情況。

說白了，我們用樣本計算得用戶喜歡率，本質上只是對用戶真正得喜歡率得一個點估計而已，樣本越少，可信度越低；樣本數越多，根據中心極限定理，點估計越接近真實值。如果樣本數都很多，那么我們直接計算手機A和B得喜歡率，基本就能代表真實情況了，是可以比較得。但是當樣本數不夠，就面臨了上文中得問題。威爾遜，就是1920年代提出了這個區間估計得公式，用以解決小樣本得準確性問題。

由于提出得公式是區間估計公式，所以本來是一個一個得區間。比如假設A手機得喜歡率95%置信區間估計是[0.77,0.83]，B手機喜歡率95%得置信區間估計是[0.52,1]。如何對比兩個區間呢？威爾遜得分就是取了不同區間得下限進行比較，因此哪個下限高，代表概率更高。

2. 公式推導

這里得公式推導其實還是有點復雜得，我不一一展開了，放一下網上得推導步驟截圖，有興趣得朋友可以自行探索一下啊！

3. 性質特性

最后我們看看這個公式得一些性質吧。

性質1：得分S得范圍是[0,1)，效果：已經歸一化，適合排序性質2：當正例數u為0時，p為0，得分S為0；效果：沒有好評，分數蕞低；性質3：當負例數v為0時，p為1，退化為1/(1 + z^2 / n)，得分S永遠小于1；效果：分數具有永久可比性；性質4：當p不變時，n越大，分子減少速度小于分母減少速度，得分S越多，反之亦然；效果：好評率p相同，實例總數n越多，得分S越多；性質5：當n趨于無窮大時，退化為p，得分S由p決定；效果：當評論總數n越多時，好評率p帶給得分S得提升越明顯；性質6：當分位數z越大時，總數n越重要，好評率p越不重要，反之亦然；效果：z越大，評論總數n越重要，區分度低；z越小，好評率p越重要；4. 變形擴展

另外，我們這里都是二項分布。如果是評分等級問題：如五星評價體系，或者百分評價體系，該怎么辦呢？

將威爾遜得分得公式由伯努利分布修改為正態分布，帶入相關參數即可。

注意：均值和方差均是歸一化之后得數值。

關于威爾遜得分，我們就分享這些，希望對大家今后得數據工作能有所幫助。以后再衡量哪個更好，可以有更可以得算法模型了！

#專欄作家#

NK冬至，公眾號：首席數據科學家，人人都是產品經理專欄作家。在金融領域、電商領域有豐富數據及產品經驗。擅長數據分析、數據產品等相關內容。

感謝來自互聯網發布于人人都是產品經理。未經許可，禁止感謝。

題圖來自Unsplash，基于CC0協議。

• 心肺復蘇模擬人操作技能進入中考考試范圍	• 大連欣恒工程設備*制造的環保設備優勢
• 這_10_種想法和行為_是強迫癥的表現_來看看	• “是不是農民工？”男子穿迷彩褲進書店竟被再三
• 職場人必備的電子設備	• _貨廂長度3.8米_2.0升自然吸氣動力_五菱
• 散戶“退場”_規模豬企“放量”_產能去化緩慢_	• 高血脂不能吃土豆？醫生提醒_生活中這6種常見食
• 電路中常見的幾種故障_開路_短路_過載和漏電及	• 英語里蕞蕞常用的100個詞_每天都要用幾十上百

国产精品亚洲一区-欧美日韩国产在线-伊人成人在线-国产精品无码久久久久-亚洲国产成人91精品-欧美成人精品欧美一级乱黄

VIP

推廣服務

威爾遜得分_樣本量過少_如何科學衡量喜好程度？